
Лемматизация
Лемматизация – это механизм приведения словоформы к лемме (первоначальной форме). Этот метод морфологического анализа используется в процессе схематизации веб-страниц в поисковой базе при индексировании. Лемматизация позволяет удалять флективные окончания и восстанавливать основную словарную форму слов в ключевом запросе.
Примеры словарных форм
- замурованными – замурованный;
- покупали – покупать;
- свечками – свеча.
При индексации не всегда лемматизация является точной, так как поисковые машины обычно учитывают одну из возможных лемм из текста веб-документа.