Lucene&Solr
SyyFeng
只能愈战愈勇
展开
-
Lucene Field域,索引&搜索
1 Field域1.1 Field属性Field是文档中的域,包括Field名和Field值两部分,一个文档可以包括多个Field,Document只是Field的一个承载体,Field值即为要索引的内容,也是要搜索的内容。 l 是否分词(tokenized)是:作分词处理,即将Field值进行分词,分词的目的是为了索引。比如:商品名称、商品简介等,这些内容用户要输入关键字搜索原创 2017-10-15 21:22:13 · 878 阅读 · 0 评论 -
中文分词器
1.1 什么是中文分词器学过英文的都知道,英文是以单词为单位的,单词与单词之间以空格或者逗号句号隔开。而中文则以字为单位,字又组成词,字和词再组成句子。所以对于英文,我们可以简单以空格判断某个字符串是否为一个单词,比如I love China,love和 China很容易被程序区分开来;但中文“我爱中国”就不一样了,电脑不知道“中国”是一个词语还是“爱中”是一个词语。把中文的句子切分成原创 2017-10-15 21:29:23 · 521 阅读 · 1 评论 -
相关度排序
1 相关度排序1.1 什么是相关度排序相关度排序是查询结果按照与查询关键字的相关性进行排序,越相关的越靠前。比如搜索“Lucene”关键字,与该关键字最相关的文章应该排在前边。 1.2 相关度打分Lucene对查询关键字和索引文档的相关度进行打分,得分高的就排在前边。如何打分呢?Lucene是在用户进行检索时实时根据搜索的关键字计算出来的,分两步:1)计算出词(Term)的权重原创 2017-10-15 21:33:41 · 4815 阅读 · 0 评论 -
Solr和Lucene
1.1 什么是solrSolr是apache的顶级开源项目,它是使用java开发 ,基于lucene的全文检索服务器。 Solr比lucene提供了更多的查询语句,而且它可扩展、可配置,同时它对lucene的性能进行了优化。 Solr是如何实现全文检索的呢? 索引流程:solr客户端(浏览器、java程序)可以向solr服务端发送POST请求,请求内容是包含Field等信息的一个x原创 2017-10-15 23:09:21 · 2440 阅读 · 0 评论 -
Solr安装配置
下载地址:http://archive.apache.org/dist/lucene/solr/下载版本:4.10.3Linux下需要下载lucene-4.10.3.tgz,windows下需要下载lucene-4.10.3.zip。1.1运行环境lJdk:1.7及以上lSolr:4.10.3lMysql:5XlWeb服务器:tomcat 71.1....原创 2017-10-15 23:13:36 · 159 阅读 · 0 评论 -
Solr的基本使用
1Solr的基本使用1.1Schema.xml在schema.xml文件中,主要配置了solrcore的一些数据信息,包括Field和FieldType的定义等信息,在solr中,Field和FieldType都需要先定义后使用。1.1.1Filed定义Field域<field name="id" type="string" indexed="true" sto...原创 2017-10-15 23:34:23 · 184 阅读 · 0 评论