Phpnow配置使用SCWS 分词系统

原创 2011年01月24日 09:33:00

      我这里要讲的是一个网上免费的分词系统,个人认为这个系统还是不错的,在对一些文章的关键词上抓取还是不错的,虽然词库量不是很大,但是基本已经满足大多数网站的需求。

      由于现在很多人使用集成环境,或者对于新手来说使用集成环境更容易上手,在网上我发现并没有针对PHPNOW集成系统的分词的配置的介绍,现在拿出来和大家分享下,虽然很简单,但是我相信对很多人还是有用的。

1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。

   目前支持 PHP-4.4.x 和 PHP-5.2.x 系列,下载地址分别为:

   php-4.4.x: http://www.ftphp.com/scws/down/scws_1.1.1_win32_php-4.4.x.zip

   php-5.2.x: http://www.ftphp.com/scws/down/scws_1.1.1_win32_php-5.2.x.zip

2. 将下载后的 zip 文件解压缩得到里面的 php_scws.dll ,将该文件放到 phpnow安装目录的
   PHPnow-1.5.3/php-5.2.9-2-Win32/etc 下
3. 建立一个本地目录放规则集文件和词典文件,建议使用:D:/PHPnow-1.5.3/php-5.2.9-2-Win32/scws/etc 下
4. 从 scws 主页上下载词典文件,解压后将 *.xdb 放到上述目录中
   词典系列:http://www.ftphp.com/scws/down/scws-dict-chs-gbk.tar.bz2
                  http://www.ftphp.com/scws/down/scws-dict-chs-utf8.tar.bz2
                  http://www.ftphp.com/scws/down/scws-dict-cht-utf8.tar.bz2
5.修改php-apache2handler.ini ,位于PHPnow-1.5.3/php-5.2.9-2-Win32/php-apache2handler.ini
   在 php.ini 的末尾加入以下几行:
   [scws]
   ;
   ; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
   ; 再把 php_scws.dll 指定为绝对路径。
   ;
   extension = php_scws.dll
   scws.default.charset = gbk
   scws.default.fpath = "D:/PHPnow-1.5.3/php-5.2.9-2-Win32/scws/etc"
6.重启服务器即可。
   感谢 http://www.ftphp.com/scws/index.php   开源免费的简易中文分词系统

相关文章推荐

中科院分词ICTCLAS汉语分词系统简单配置

汉语分词一直来说都是进行文本分析的瓶颈,这里介绍一个汉语分词系统ICTCLAS,全球很受欢迎的汉语分词开源系统,曾获得首界国际分词大赛综合排名第一,国家973评测第一名;支持词典,多级词性标注,支持人...

使用NLPIR-ICTCLAS2014分词系统

使用NLPIR-ICTCLAS2014分词系统

Python环境下NIPIR(ICTCLAS2014)中文分词系统使用攻略

PyNLPIR
  • noter16
  • noter16
  • 2016年09月18日 14:50
  • 736

中文分词系统NLPIR(2015版)的Java接口使用学习

前言:         这几天数据挖掘的大作业又用到分词了,首先想到的肯定是中科院的分词系统NLPIR,但是之前用的事2013版的,2015版的有了新的变化。增加了函数和效率自是不必说,由于我是用的j...

NLPIR分词系统(ICTCLAS 2013)在VS 2013中使用

NLPIR汉语分词系统(又名ICTCLAS 2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。 0.官方网站http://ictcl...

ictclas分词系统的使用,java调用,附带连接mysql进行读写。

1.进入官网下载 ictclas2013下载包,目前更新到0416版,ictclas2013-Win-32-jni或者64位的。如果系统是32位的就下载32位的,如果是64位的系统,那就要看你安装的...

【11月22日】听说下雪了!--ICATCLAS分词系统使用初探

} 最近有用一个中科院的中文分词系统,感觉蛮颇爽。 NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编...

NLPIR中文分词系统之Java接口的使用

昨天接到经理的安排,让我做项目中的分词模块并介绍说可以使用中科院的ICTCLAS(最新版本改名为NLPIR)中文分词系统。于是自己花了一下午的时间来了解它,并试着搭建测试环境;这方面的资料比较少,幸好...

NLPIR汉语分词系统在VS中使用

首先去官网下载NLPIR(ICTCALS)包。   点我下载   由于笔者在项目中需要用到mysql数据库,而笔者数据库是64位的,所以,笔者这里下载了32位的NLPIR下载包后,又下载了64位的补充...

使用NLPIR汉语分词系统进行分词

今天尝试了用张华平博士打造的汉语分词系统进行分词测试,遇到了一些问题,最终还是分词成功,首先感谢NLPIR提供的源码及资料,现将使用过程中遇到的问题及解决方法分享出来,仅供参考。 NLPIR提供了多...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Phpnow配置使用SCWS 分词系统
举报原因:
原因补充:

(最多只允许输入30个字)