Установите последовательность предложений в тексте:
nbsp;В общей формулировке задачки построения системы
Установите последовательность предложений в тексте:
nbsp;В общей формулировке задачки построения системы автоматического реферирования и аннотирования отмечалось, что реферат представляет собой последовательность главных предложений текста.
nbsp;Само же ключевое предложение было определено как такое предложение текста, в котором содержится три и более разных опорных слова.
nbsp;Потому подзадачу блока G сформулируем последующим образом: Читая последовательно все предложения текста, выделить и запомнить те из их, в которых содержится три и более различных основных либо второстепенных опорных слова данного текста.
nbsp;Результатом работы блока G является реферат текста - последовательность ключевых предложений, в каждом из которых найдено три и более опорных словоформ текста.
Установите последовательность предложений в тексте:
nbsp;В самом начале работы по автоматическому реферированию и аннотированию текста в память компьютера вводится перечень предлогов, артиклей, наречий, союзов, числительных, вспомогательных глаголов, местоимений, а также общеупотребительных имен прилагательных и причастий.
nbsp;Обрабатываемый текст теснее находится в компьютерной памяти (блок А).
nbsp;Далее начинается последовательное чтение отдельных предложений.
nbsp;В каждом прочитанном предложении компьютер разыскивает опорную словоформу - имя
существительное.
Установите последовательность предложений в тексте:
nbsp;Дальше начинается последовательное чтение отдельных предложений.
nbsp;В каждом прочитанном предложении компьютер разыскивает опорную словоформу - имя
существительное.
nbsp;Если она найдена, то компьютер выделяет из предложения словоформу, стоящую перед опорной, и сопоставляет ее с введенным ранее в память списком служебных и общеупотребительных словоформ.
nbsp;Словоформу-определение, не найденную в таком списке, компьютер объединяет со стоящим за ней опорным именованием существительным и передает полученное словосочетание в специальную область памяти для ключевых словосочетаний текста.
Установите последовательность предложений в тексте:
nbsp;Дальше необходимо увидеть, что отнесение определителей к классам имени прилагательного и причастия может быть осуществлено по упомянутому выше автоматическому словарю.
nbsp;А выделение посреди имен прилагательных и причастий общеупотребительных словоформ может быть изготовлено только методом сопоставленья каждого определения со особым списком общеупотребительных имен прилагательных и причастий, помещенным в память компьютера.
nbsp;Беря во внимание произнесенное, подзадачу, которая обязана быть решена в блоке F, сформулируем так:
nbsp;Читая последовательно все предложения текста, выделить в их главные словосочетания (в обозначенном выше осознании), расположить их по алфавиту и удалить из их однообразные.
Установите последовательность предложений в тексте:
nbsp;Среди ключевых словоформ текста может быть установлена последующая иерархия.
nbsp;Одни из них - основные опорные слова (ГОС) - являются неподражаемо главными для текста.
nbsp;Они встречаются с наивеличайшей частотой в большенном числе абзацев.
nbsp;Другие опорные слова встречаются с меньшей частотой и в меньшем числе абзацев.
Установите последовательность предложений в тексте:
nbsp;Исключение из распределительного словаря хоть какой словоформы служебного либо общеупотребительного слова, грамматической формы, синонима, словоформ, встречающихся в одном абзаце, исполняется в виде сжатия распределительного словаря, с тем чтоб в нем не осталось негодных словоформ.
nbsp;При этом компьютер опирается на заблаговременно заданный список запрещенных слов.
nbsp;Итогом работы блока D является словарь возможных опорных словоформ начального текста.
nbsp;Главным аспектом для творения словаря основных и второстепенных опорных словоформ текста (блок Е) является, как теснее было отмечено выше, коэффициент значимости слова.
Установите последовательность предложений в тексте:
nbsp;Соединение данных о синонимичных словоформах проводится с опорой на тот факт, что такие словоформы в тексте по нашему начальному условию заключены в скобки и располагаются друг за другом.
nbsp;Найдя главную словоформу, компьютер соединяет ее частоту с частотой синонима, уточняет число и определенные номера абзацев по такому же принципу, как это было показано для объединения грамматических форм 1-го и того же слова.
nbsp;В итоге будут получены, к примеру, два условных слова.
nbsp;И заключительнее, самое обычное действие связано с исключением из распределительного алфавитно-частотного словаря тех словоформ, которые повстречались только в одном абзаце.
Установите последовательность предложений в тексте:
nbsp;Осмотрим несколько подробнее деяния компьютера по соединенью грамматических форм одного и того же слова.
nbsp;Он поочередно анализирует все словоформы распределительного словаря, начинающиеся с одной и той же буквы.
nbsp;На первом шаге такого анализа она выделяет у 2-ой из 2-ух сопоставляемых
словоформ одну последнюю буковку и оставшуюся часть второй словоформы сопоставляет с первой словоформой.
nbsp;Если они совпадают, компьютер суммирует частоты этих словоформ, устанавливает номера абзацев, в которых повстречались эти словоформы, и определяет общее количество абзацев, в которых они использовались.
Установите последовательность предложений в тексте:
nbsp;Синонимичными для компьютера являются и грамматические формы одних и тех же слов: chip и chips, circuit и circuits, small и smaller и т.д.
nbsp;Отыскать и соединить эти словоформы компьютер может самостоятельно, без специального предредактирования текста человеком.
nbsp;В итоге выходит единичное условное слово, речь о котором шла выше.
nbsp;Говоря о 2-ой из 3-х упомянутых выше особенностей ключевых слов, условимся, что в число потенциальных опорных словоформ текста будем включать только те из словоформ в таблице 9, которые повстречались в 2-ух и более абзацах.
-
Вопросы ответы
Статьи
Информатика
Статьи
Разные вопросы.
Математика.
Физика.
Геометрия.
Разные вопросы.
Обществознание.
Математика.
Химия.
Русский язык.
Разные вопросы.