自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Elasticsearch集群入门2

本篇主要记录一些看Elasticsearch Server second edition第一章的一些对于Lucene和Elasticsearch基本知识的理解。索引的基础是倒排索引,倒排索引是面向单词的而不是面向文档的,每一个词相当于每一条记录的主键,记录中包括词出现的次数,出现过的文档的标识符集合等信息。每个索引建立之后,可以在磁盘上看到有多个段文件,每个段文件在建立索引

2015-10-24 23:46:37 463

原创 Elasticsearch集群入门

安装Elasticsearch(win):从www.elasticsearch.org/download下载即可,按照网站上提示的安装步骤来就行,win下运行elasticsearch.bat即可,建议先开一个cmd,然后在cmd中运行该bat文件,方便查看异常问题。如果报错说系统找不到路径,或者说你已经在环境变量中配置了JAVA_HOME为jdk的路径,但是在运行service.bat时扔报

2015-10-17 13:32:04 792

原创 词形还原(lemmatization)和词性辨别(PartOfSpeech)工具

词干提取不难,网上有很多波特词干算法的实现。词形还原的话,自己在网上寻找了一下,发现Stanford的NLP库可用,具体链接:http://nlp.stanford.edu/software/corenlp.shtml这个是corenlp那个包的介绍网址,还有其他的很多包可以自行查看。用法示例:StringBuilder stringBuilder = new String

2015-10-16 20:14:26 3864 2

原创 win8.1安装apache+php

下载apache:apache下载网址:http://httpd.apache.org/download.cgi找到想下载的版本,点击file for microsoft windows下载网站选择apachehaus即可根据你的机器上装的vs版本(2008 or 2012)选择vc9或者vc11版本下载,32位或者64位解压之后,放到某个地方,我的路径是F:\program

2015-09-26 01:54:56 966

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除