- 博客(5)
- 资源 (4)
- 收藏
- 关注
转载 solr 3.4配置中文分词IKAnalyzer3.2.8
最近在折腾solr,现在需要让其支持中文分词,在网上看到了很多关于使用paoding中文分词的文章,但是测试很久都不行,而且paoding这个分词工具很久没更新了,最新版本是paoding-analysis-2.0.4-beta.zip,于是在想有没有其它的分词工具可以使用,后来找到了IKAnalyzer,仔细看了下,感觉很不错,关键是配置很容易,参照一篇文章中的例子http://blog.sin
2014-01-24 16:41:00 710
转载 nutch1.3集成solr3.4并支持中文
(一)安装nutch1.3 1.linux环境,分别从nutch、solr官网下载1.3版本和3.4版本压缩包 2.分别解压,假定nutch目录为/nutch1.3,solr目录为/apache-solr-3.4.0 3.进入/nutch-1.3/runtime/local目录,vibin/nutch,设置JDK1.6路径 NUTCH_JAVA_HOME=/usr/
2014-01-24 11:39:28 599
转载 用于Lucene的各中文分词比较
对几种中文分析器,从分词准确性和效率两方面进行比较。分析器依次为:StandardAnalyzer、ChineseAnalyzer、CJKAnalyzer、IK_CAnalyzer、MIK_CAnalyzer、MMAnalyzer(JE分词)、PaodingAnalyzer。 单纯的中文分词的实现一般为按字索引或者按词索引。按字索引顾名思义,就是按单个字建立索引。按词索引就是按词喽,根据词库中的
2014-01-24 09:34:52 1397
原创 swift 杀毒 和ClamAV集成
This article will guide you through the installation of ClamAV on CentOS. Once installed, we will also configure a daily scan on our CentOS server. ClamAV is an open source (GPL) antivirus engine des
2014-01-20 09:51:17 711
转载 Openstack Swift Quotas
wift组件是Openstack的对象存储(Object Storage)解决方案。在早期的版本中,swift对于配额是没有限制的,不能够对不同用户所使用的空间进行限制。后来出现了开源的中间件 swquota(https://github.com/cschwede/swquota)可以对swift做出配额的限制,如今在2013年4月发布的Grizzly版本Openstack中,swift(1.8.
2014-01-06 15:47:25 1559
Oracle OCP 认证教材Administration.II.Exam.Guide.Exam.1Z0-053(英文版)
2011-03-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人