![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索引擎
will的成长之路
个人成长记录
展开
-
solr5.4.1 quick start
solr的重大变化:从5.0开始,solr不再以war包发布(war包可以部署到任何servlet容器中),而是以独立的java服务器程序的形式发布(基于内嵌的jetty),它有启动/停止脚本,还有安装脚本用于在类unix上安装一个solr产品,后续版本不支持部署到其他的servlet容器上(如tomcat)。系统要求: JDK>=1.7,不要使用JVM实验性的-XX参数官网原创 2016-01-30 12:19:46 · 1673 阅读 · 0 评论 -
solr常用命令总结
查看帮助bin/solr -help 可以看到solr有哪些子命令,如 start, stop, restart, status, healthcheck, create, create_core, create_collection, delete, version启动startbin/solr start -help 查看start帮原创 2016-02-01 21:41:21 · 22910 阅读 · 0 评论 -
Solr搭建真实项目
在经过solr5.4.1 quick start 的学习后,我们要搭建真实的项目了1、启动项目bin/solr start2、创建corebin/solr create -c pms3、为新创建的core添加配置文件在pms/conf/solrconfig.xml中添加 db-data-config原创 2016-02-02 21:17:33 · 2973 阅读 · 0 评论 -
solr跨core查询
参考文档:这里的跨core不使用solrcloudhttp://wiki.apache.org/solr/CoreAdmin注意:跨core查询功能相比单core查询,是有限制的只需要在url中添加shards.info=true和shards=host:port/base_url[,host:port/base_url]举例http://loc原创 2016-02-16 15:58:05 · 4135 阅读 · 0 评论 -
solr对mysql中tinyint字段的处理方法
在使用DIH(Data Import Handler)创建索引时,mysql中的tinyint类型的字段会被转换为java的boolean类型,值为true、false,很多情况下这是不符合要求的。如果要保持数字类型,需要在sql语句中转换例如:select id,convert(with_costs,SIGNED) as with_costs from table_a;解原创 2016-02-17 20:14:17 · 2981 阅读 · 0 评论 -
11款开放中文分词引擎大比拼
在逐渐步入DT(Data Technology)时代的今天,自然语义分析技术越发不可或缺。对于我们每天打交道的中文来说,并没有类似英文空格的边界标志。而理解句子所包含的词语,则是理解汉语语句的第一步。汉语自动分词的任务,通俗地说,就是要由机器在文本中的词与词之间自动加上空格。一提到自动分词,通常会遇到两种比较典型的质疑。一种质疑是来自外行人的:这件事看上去平凡之极,好像一点儿也不“fancy”转载 2016-01-30 12:27:44 · 4553 阅读 · 0 评论 -
搜索引擎的比较和选择:Elasticsearch与Solr
搜索引擎选择: Elasticsearch与Solr搜索引擎选型调研文档Elasticsearch简介*Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™转载 2016-01-30 12:12:43 · 6907 阅读 · 0 评论 -
lucene、solr、nutch三者的关系
lucene是一个做搜索用的类库。 nutch和solr都是基于lucene的,二者都是可直接运行的应用程序;直接在业务上使用lucene的倒是不太多见。 solr主要提供了建立索引(用户可以直接post数据给solr,然后由solr进行索引)和提供查询索引的功能(它内嵌了jetty,可以直接提供HTTP服务);nutch一般用作爬虫使用,负责抓取数据。solr的重大变化:从原创 2016-01-30 11:24:58 · 6373 阅读 · 1 评论