- 博客(4)
- 收藏
- 关注
原创 Elasticsearch集群入门2
本篇主要记录一些看Elasticsearch Server second edition第一章的一些对于Lucene和Elasticsearch基本知识的理解。索引的基础是倒排索引,倒排索引是面向单词的而不是面向文档的,每一个词相当于每一条记录的主键,记录中包括词出现的次数,出现过的文档的标识符集合等信息。每个索引建立之后,可以在磁盘上看到有多个段文件,每个段文件在建立索引
2015-10-24 23:46:37 463
原创 Elasticsearch集群入门
安装Elasticsearch(win):从www.elasticsearch.org/download下载即可,按照网站上提示的安装步骤来就行,win下运行elasticsearch.bat即可,建议先开一个cmd,然后在cmd中运行该bat文件,方便查看异常问题。如果报错说系统找不到路径,或者说你已经在环境变量中配置了JAVA_HOME为jdk的路径,但是在运行service.bat时扔报
2015-10-17 13:32:04 792
原创 词形还原(lemmatization)和词性辨别(PartOfSpeech)工具
词干提取不难,网上有很多波特词干算法的实现。词形还原的话,自己在网上寻找了一下,发现Stanford的NLP库可用,具体链接:http://nlp.stanford.edu/software/corenlp.shtml这个是corenlp那个包的介绍网址,还有其他的很多包可以自行查看。用法示例:StringBuilder stringBuilder = new String
2015-10-16 20:14:26 3864 2
原创 win8.1安装apache+php
下载apache:apache下载网址:http://httpd.apache.org/download.cgi找到想下载的版本,点击file for microsoft windows下载网站选择apachehaus即可根据你的机器上装的vs版本(2008 or 2012)选择vc9或者vc11版本下载,32位或者64位解压之后,放到某个地方,我的路径是F:\program
2015-09-26 01:54:56 966
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人