Прикладное программное обеспечение: системы автоматической обработки текстов [Михаил Георгиевич Мальковский] (fb2) читать постранично, страница - 25
[Настройки текста] [Cбросить фильтры]
[1] Отметим, что в рекламе или обзорах поисковых средств часто можно встретить слова "индексирование" или "индексация". Там эти термины означают создание общего глоссария по всему массиву для увеличения скорости поиска. Для всей текстовой базы составляется список встречающихся в ней терминов, и каждому из них ставится в соответствие некоторый индекс (координаты в текстовой базе); чаще всего это номер документа и номер слова в документе. При поступлении запроса слово сначала ищется в этом списке, и по найденным координатам выдаются нужные документы. Если слов в запросе несколько, над их координатами производится операция пересечения. Именно так организован поиск статей, включающих заданное слово, в подсистемах помощи Windows.
Последние комментарии
2 дней 17 часов назад
2 дней 17 часов назад
2 дней 18 часов назад
2 дней 18 часов назад
2 дней 20 часов назад
2 дней 20 часов назад