2017 © Pedro Peláez
 

library lingua-stem-ru

Стеммер Портера. Извлечение корня из русского слова, без словаря.

image

ladamalina/lingua-stem-ru

Стеммер Портера. Извлечение корня из русского слова, без словаря.

  • Sunday, September 24, 2017
  • by ladamalina
  • Repository
  • 1 Watchers
  • 9 Stars
  • 1,248 Installations
  • PHP
  • 1 Dependents
  • 0 Suggesters
  • 6 Forks
  • 1 Open issues
  • 1 Versions
  • 0 % Grown

The README.md

Стеммер Портера

Извлечение корня из русского слова, без словаря., (*1)

Стеммер Портера — алгоритм стемминга, опубликованный Мартином Портером в 1980 году. Оригинальная версия стеммера была предназначена для английского языка. Впоследствии Мартин создал проект «Snowball» и, используя основную идею алгоритма, написал стеммеры для распространённых индоевропейских языков, в том числе для русского., (*2)

Алгоритм не использует морфологический словарь, а только применяя последовательно ряд правил, отсекает окончания и суффиксы, основываясь на особенностях языка, в связи с чем работает быстро, но не всегда безошибочно., (*3)

Пример использования:

$stemmer = new LinguaStemRu();
echo $stemmer->stem_word('Автомобиль') . "<br/>";
echo $stemmer->stem_word('Автомобилем') . "<br/>";
echo $stemmer->stem_word('Автомобиля') . "<br/>";

В результате получим три раза слово автомобил., (*4)

$stemmer = new LinguaStemRu();
echo $stemmer->stem_text('Любовь к Родине – это очень сильное чувство.');

Получим:, (*5)

любов к родин – это очен сильн чувство., (*6)

The Versions

24/09 2017

dev-master

9999999-dev

Стеммер Портера. Извлечение корня из русского слова, без словаря.

  Sources   Download

MIT

The Requires

  • php >=5.3.0

 

The Development Requires

by Nadezhda Ryabtsova