今天登录sae,发现应用菜单底部赫然出现了"中文分词服务"功能,真是让人意外的惊喜.以往我都是自己在本地分词.然后再传到服务器上的.不然只能够用模糊匹配的方式来搜索,或者单字分词,这样性能很难保证. 分词也是目前手头上的一个人工智能项目的基础.真是太感谢新浪了~~希望sae以后能分享更多的服务.gae就小气多了只有英文的分词.几乎不用分的.希望Google或者百度公布自己的分词系统,要不提供api什么的.
介绍一下sae的分词服务功能:
目前还处于alpha状态.但是是可以使用的.你到后台点击一下启用分词服务功能就行.
服务说明:
saeSegment是由新浪爱问提供的分词服务,是扩展服务。
该服务分词准确率高,而且可以返回给每个词的词性,详细使用方法请看API文档 。
使用示例:
<?php
$str = "明天星期天";
$seg = new SaeSegment();
$ret = $seg->segment($str, 1);
print_r($ret); //输出
// 失败时输出错误码和错误信息
if ($ret === false)
var_dump($seg->errno(), $seg->errmsg());
?>
目前还是免费,邀请注册链接:http://sae.sina.com.cn/activity/invite/25993/weibo