2017 © Pedro Peláez
 

library php-split

php ZH

image

callwoola/php-split

php ZH

  • Wednesday, October 18, 2017
  • by Callwoola
  • Repository
  • 4 Watchers
  • 27 Stars
  • 156 Installations
  • PHP
  • 0 Dependents
  • 0 Suggesters
  • 11 Forks
  • 0 Open issues
  • 5 Versions
  • 93 % Grown

The README.md

phpSplit php中文分词库

Build Status, (*1)

phpSplit 是一个基于php开发的中文分词库

居于Unicode编码词典的php分词器 * 只适用于php5,必要函数 iconv * 本程序是使用RMM逆向匹配算法进行分词的,词库需要特别编译,本类里提供了 MakeDict() 方法 * 简单操作流程: SetSource -> StartAnalysis -> GetResult * 对主词典使用特殊格式进行编码, 不需要载入词典到内存操作, (*2)

使用

  • 首先 确保使用php为5.4+
  • 安装composer
composer install
require __DIR__ .'/vendor/autoload.php';
$split = new \phpSplit\Split\Split();
var_dump($split->simple("您好 phpSplit"));
array(3) {
  [0] =>
  string(0) ""
  [1] =>
  string(6) "您好"
  [2] =>
  string(8) "phpSplit"
}

分词结果后缀说明

名词n、
时间词t、
处所词s、
方位词f、
数词m、
量词q、
区别词b、
代词r、
动词v、
形容词a、
状态词z、
副词d、
介词p、
连词c、
助词u、
语气词y、
叹词e、
拟声词o、
成语i、
习用语l、
简称j、
前接成分h、
后接成分k、
语素g、
非语素字x、
标点符号w

同事增加了以下3类标记 *专有名词的分类标记,即人名nr,地名ns,团体机关单位名称nt,其他专有名词nz; *语素的子类标记,即名语素Ng,动语素Vg,形容语素Ag,时语素Tg,副语素Dg等; *动词和形容词的子类标记,即名动词vn(具有名词特性的动词),名形词an(具有名词特性的形容词),副动词vd(具有副词特性的动词),副形词ad(具有副词特性的形容词), (*3)

合计约40个左右。, (*4)

欢迎大家完善, (*5)

The Versions

18/10 2017

dev-master

9999999-dev

php ZH

  Sources   Download

The Requires

 

The Development Requires

by neo

18/10 2017

1.1.1

1.1.1.0

php ZH

  Sources   Download

The Requires

 

The Development Requires

by neo

24/11 2015

1.1.0

1.1.0.0

php ZH

  Sources   Download

The Requires

 

The Development Requires

by neo

23/11 2015

dev-develop

dev-develop

php ZH

  Sources   Download

The Requires

 

The Development Requires

by neo

04/10 2015

1.0.0

1.0.0.0

php ZH

  Sources   Download

The Requires

 

The Development Requires

by neo