- Стемминг
-
Стемматиза́ция (сте́мминг) — это процесс нахождения основы слова для заданного исходного слова. Основа слова необязательно совпадает с морфологическим корнем слова. Алгоритм стемматизации представляет собой давнюю проблему в области компьютерных наук. Первый документ по этому вопросу был опубликован в 1968 году. Данный процесс применяется в поиcковых системах для обобщения поискового запроса пользователя.
Конкретные реализации стемматизации называются алгоритм стемматизации или просто стеммер.
Методы
Для стемматизации существует множество различных методов, по разному подходящих к разным языкам.
- Стеммер Портера
- KSTEM
- N-грамма
См. также
Категории:- Информационный поиск
- Морфология (лингвистика)
- Обработка естественного языка
Wikimedia Foundation. 2010.