Михаил Мальковский - Прикладное программное обеспечение: системы автоматической обработки текстов Страница 15
- Категория: Научные и научно-популярные книги / Языкознание
- Автор: Михаил Мальковский
- Год выпуска: -
- ISBN: -
- Издательство: -
- Страниц: 15
- Добавлено: 2019-02-04 13:36:49
Михаил Мальковский - Прикладное программное обеспечение: системы автоматической обработки текстов краткое содержание
Прочтите описание перед тем, как прочитать онлайн книгу «Михаил Мальковский - Прикладное программное обеспечение: системы автоматической обработки текстов» бесплатно полную версию:Учебное пособие знакомит читателей с одной из наиболее интересных и перспективных задач прикладного программирования - задачей автоматической обработки тестов на естественном языке. Рассмитриваются рациональные сферы применения систме автоматической обработки текстов , проблемы их линвистиеского обеспечения. Для студентов 2 курса факультета ВМК МГУ в поддержку обязательного лекционного курса "Прикладное программное обеспчение". Авторы пособия благодарят Владимира Геннадиевича Абрамова и Валерия Ивановича Родина за ценные советы и замечания. Рецензенты: проф. Р.Л. Смелянский, доц. Л.С. Корухова. Печатается по решению Редакционно-издательского совета факультета вычислительной математики и кибернетики МГУ им. М.В. Ломоносова.
Михаил Мальковский - Прикладное программное обеспечение: системы автоматической обработки текстов читать онлайн бесплатно
Развитые информационно-поисковые языки допускают использование логических связок: дурак=NOT(умный), добрый молодец=(мужчина) AND (молодой). В перспективе - возможность описания на информационно-поисковом языке смысла целой фразы (который не всегда складывается из смыслов входящих в нее слов) и возможность формулировки соответствующих семантически сложных запросов.
[1] Отметим, что в рекламе или обзорах поисковых средств часто можно встретить слова "индексирование" или "индексация". Там эти термины означают создание общего глоссария по всему массиву для увеличения скорости поиска. Для всей текстовой базы составляется список встречающихся в ней терминов, и каждому из них ставится в соответствие некоторый индекс (координаты в текстовой базе); чаще всего это номер документа и номер слова в документе. При поступлении запроса слово сначала ищется в этом списке, и по найденным координатам выдаются нужные документы. Если слов в запросе несколько, над их координатами производится операция пересечения. Именно так организован поиск статей, включающих заданное слово, в подсистемах помощи Windows.
Жалоба
Напишите нам, и мы в срочном порядке примем меры.