腾讯文智java近义词API_常用的分词组件或API,该怎么选型?

做互联网系统 分词是必不可少的。除非咱不需要搜索、标签或者关键字分析等。

在网上看到的一个列表,不错,放出来给大家。

这里简单点评下:(我简单体验了几个,没有全部用,像搜狗之类的,看下名称我就不想用,想来也不是很好用,不要问为什么)

如果是为了快速实现功能,而且我们没有太多的二次开发力量,那么我们应该使用REST API 模式的分词接口。直接调用,人家更新我们也自动跟着更新。不过,一旦人家歇菜,我们也跟着歇菜。所以使用REST API风格的分词要做好后手准备。另外,如果你需要有一些个性化功能,是木有的,这就是 “懒”和”笨“的代价。

REST API接口的大家可以试一下。BosonNLP和新浪云,如果专注中文,那么新浪是比较好的选择。新浪早年的产品,譬如上个世纪90年代,还是很差的。现在的新浪很多产品还是值得学习的。(呀~~~不小心暴露了年龄)

PHP分词

如果你认为PHP是世界上最好的语言,那么选择SCWS是必须的啦。需要安装扩展,自己可以修改词库,配置也方便。适合于PHP大法传人和有一定二次开发能力的人。如果你能修改源码那就更屌了。

Java分词

如果你认为其他语言都是玩具,只有java才是宇宙最强的语言。那么你可以使用IKAnalyzer,结合Lucene能实现相对比较完善的搜索系统。

如果有能力可以看看源码,修改并不是特别复杂。总比看C要简单的多

其他的几个 我就看了看,也没啥兴趣用。

从性价比来说,我只会选在REST API模式的分词。我认为在我有生之年不太可能”他们死了,我还活着”。另外,分词已经不值得我们这些商业程序员去做深入研究。当然如果你是基础技术建设者另当别论。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值