dev-master
9999999-devСтеммер Портера. Извлечение корня из русского слова, без словаря.
MIT
The Requires
- php >=5.3.0
The Development Requires
by Nadezhda Ryabtsova
Wallogit.com
2017 © Pedro Peláez
Стеммер Портера. Извлечение корня из русского слова, без словаря.
Извлечение корня из русского слова, без словаря., (*1)
Стеммер Портера — алгоритм стемминга, опубликованный Мартином Портером в 1980 году. Оригинальная версия стеммера была предназначена для английского языка. Впоследствии Мартин создал проект «Snowball» и, используя основную идею алгоритма, написал стеммеры для распространённых индоевропейских языков, в том числе для русского., (*2)
Алгоритм не использует морфологический словарь, а только применяя последовательно ряд правил, отсекает окончания и суффиксы, основываясь на особенностях языка, в связи с чем работает быстро, но не всегда безошибочно., (*3)
$stemmer = new LinguaStemRu();
echo $stemmer->stem_word('Автомобиль') . "<br/>";
echo $stemmer->stem_word('Автомобилем') . "<br/>";
echo $stemmer->stem_word('Автомобиля') . "<br/>";
В результате получим три раза слово автомобил., (*4)
$stemmer = new LinguaStemRu();
echo $stemmer->stem_text('Любовь к Родине – это очень сильное чувство.');
Получим:, (*5)
любов к родин – это очен сильн чувство., (*6)
Стеммер Портера. Извлечение корня из русского слова, без словаря.
MIT