solr实践

在项目是使用solr已经有一段时间了,今天腾出时间来总结下。
版本:solr5.5

提纲:
垂直搜索的特点
Lucene的简单介绍
solr和Elasticsearch的区别
完整的solr介绍、使用、实践

正文:
垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户.相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务.
其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入.
Lucene是apache软件基金会 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)

Lucene和外部应用交互

倒排索引:
首先我们来看为什么顺序扫描的速度慢:
其实是由于我们想要搜索的信息和非结构化数据中所存储的信息不一致造成的。
非结构化数据中所存储的信息是每个文件包含哪些字符串,也即已知文件,欲求字符串相对容易,也即是从文件到字符串的映射。而我们想搜索的信息是哪些文件包含此字符串,也即已知字符串,欲求文件,也即从字符串到文件的映射。两者恰恰相反。于是如果索引总能够保存从字符串到文件的映射,则会大大提高搜索速度。
由于从字符串到文件的映射是文件到字符串映射的反向过程,于是保存这种信息的索引称为反向索引

倒排表

创建索引的流程

查询流程

Solr还是Elasticsearch?
这里写图片描述

solr实践:

  1. 选型 MultiCore 还是 SolrCloud?
  2. Dump数据源(支持mysql,json,xml)
  3. 分词-过滤器(demo:TN_Filter)
  4. 查询
  5. 排序
  6. 高可用部署

成功实践:
1、美团搜索框
2、美团查找附近的商家查询:
http://tech.meituan.com/solr-spatial-search.html
3、途牛汽车票地点查询

参考资料:
http://www.importnew.com/12607.html
http://www.importnew.com/12918.html
http://www.cnblogs.com/hoojo/archive/2011/10/21/2220431.html
http://www.wjxfpf.com/2015/10/500845.html
http://www.importnew.com/12770.html
http://blog.csdn.net/jcncsdn/article/details/51105612
http://www.doc88.com/p-1157698028976.html
http://mxdxm.iteye.com/blog/2191342
http://my.oschina.net/lsf930709/blog/620738?fromerr=dcbeAgwX
http://wenku.baidu.com/view/8a55776071fe910ef02df825.html
http://wenku.baidu.com/link?url=C2Yaw5Fv0lwa6wFc4DWd7EBY5y6fetPQ9gVEErDI-DoP_IHnDvRGKhirgsgRLeaXKodkRy687HfsZXJ_PFh5lu2y8b8uFUZbIksF1dIPlr3
http://blog.csdn.net/h185947768/article/details/48415501
http://blog.csdn.net/ckh8913/article/details/7313522
http://haiziwoainixx.iteye.com/blog/2095473
http://blog.csdn.net/vintage_1/article/details/50836843
Overlapping_onDeckSearchers.3DX.22_mean_in_my_logs.3F”>http://wiki.apache.org/solr/FAQ#What_does.22PERFORMANCE_WARNING:_Overlapping_onDeckSearchers.3DX.22_mean_in_my_logs.3F
http://tech.meituan.com/
http://blog.csdn.net/forfuture1978/article/details/4711308
http://blog.csdn.net/matthewei6/article/details/50610841
http://www.importnew.com/19418.html
https://www.52ml.net/15536.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值