搜索引擎
文章平均质量分 79
youmengdaigu
这个作者很懒,什么都没留下…
展开
-
Solr与Sphinx的比较
Solr与Sphinx的比较Solr版本:4.8.1Coreseek版本:3.2.14 (基于Sphinx 0.9.9 release)1.索引效率 Sphinx:10-15MB/秒, 实测最高可对100GB的文本建立索引,单一索引可包含1亿条记录 Solr:10MB/秒,亿条数据,20G索引,新浪目前也采用lucene检索2.搜索性能转载 2015-05-20 08:38:45 · 578 阅读 · 0 评论 -
Solr搜索的排序打分规则探讨
http://www.colorfuldays.org/program/solr/solr_edismax_boost/使用Solr搭建搜索引擎很容易,但是如何制定合理的打分规则(boost)做排序却是一个很头痛的事情。Solr本身的排序打分规则是继承自Lucene的文本相关度的打分即boost,这一套算法对于通用的提供全文检索的服务来讲,已经够用了,但是对于一些专门领域的搜索来讲转载 2015-06-03 08:50:27 · 434 阅读 · 0 评论 -
solr搜索打分规制排序
solr使用了Lucene的内核,也继承了Lucene的打分规则,关于Lucene打分规则可以参考如下博客http://blog.chenlb.com/2009/08/lucene-scoring-architecture.htmlSolr内改变打分规则有几种形式:1.配置solr的solrconfig.xml中edismax,来改变Boost打分规则2.在solr的sch转载 2015-06-02 15:45:00 · 1134 阅读 · 0 评论 -
sphinx在windows下的简单安装与使用
1、下载地址 http://sphinxsearch.com/downloads/release/,我这里下的是“Win64 binaries w/MySQL+PgSQL+libstemmer+id64 support”,下载后文件名:sphinx-2.0.6-release-win64-id64-full.zip;2、将其解压到D: \ sphinx,并在D:\sphinx下转载 2015-05-18 16:34:21 · 1440 阅读 · 0 评论 -
solr分页查询和高亮
二、Solr理论1、 solr基础因为 Solr 包装并扩展了 Lucene,所以它们使用很多相同的术语。更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。通过对 Solr 进行适当的配置,某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。在 Solr 和 Lucene 中,使用一个或多个 Document转载 2015-05-31 15:50:32 · 4744 阅读 · 0 评论 -
solr DataImportHandler (数据相关操作)
目录(?)[+]CommandsFull Import 例子短一点的 data-config使用增量导入命令Delta-Import 例子 XMLHTTP Datasource使用指南配置HttpDataSource在 data-configxml中的配置HttpDataSource 例子例子 索引 wikipedia使用增量导入命令Extending转载 2015-05-31 15:46:55 · 2678 阅读 · 0 评论 -
solr 4.9.1+mysql数据库数据导入
此篇基于上一篇solr4.9.1和中文分词安装完成1、上述配置好后,在solr_home文件夹中,将包含collection1文件夹,这就是solr的一个实例。collection1中包含conf和data两个子文件夹。data中包含tlog和index(如果没有也没关系,稍后再solr建立索引时,将会被创建)。tlog是记录日志的文件夹,index是存放索引的文件夹。conf中包含lang文原创 2015-05-31 15:19:48 · 937 阅读 · 0 评论 -
solr5.0 tomcat安装部署
1、将solr5解压后找打war包(solr-5.0.0\server\webapps下)。2、将war包复制到tomcat webapp下,启动tomcat 在webapp下会看到sorl文件夹,里面是解压后的sorl服务(D:\tools\apache-tomcat-private\webapps\solr)。3、将solr-5.0.0\server\lib\ext 下的jar包拷原创 2015-05-31 14:35:19 · 1183 阅读 · 0 评论 -
Solr4.9.1 安装部署平台搭建
运行环境: 运行系统:windows7(这里以windows7做实例,windows、Linux等系统下的搭建大同小异) 运行容器:apache-tomcat-7.0.47-windows-x64 Solr版本:solr-4.9.1 一、solr安装部署 1. F盘下新建winsolr文件夹,将下载的Tomcat压缩包考进winsol原创 2015-05-31 14:57:27 · 2068 阅读 · 0 评论 -
Sphinx使用及近实时索引实现
Sphinx介绍 Sphinx是由一个开源的全文检索引擎,功能类似Lucune,用C++编写,可为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成,当前系统内置MySQL和PostgreSQL数据库数据源的支持,也支持从标准输入读取特定格式的XML数据,通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBMS转载 2015-05-17 22:04:23 · 2425 阅读 · 0 评论 -
全文检索引擎Solr系列—–全文检索基本原理
场景:小时候我们都使用过新华字典,妈妈叫你翻开第38页,找到“坑爹”所在的位置,此时你会怎么查呢?毫无疑问,你的眼睛会从38页的第一个字开始从头至尾地扫描,直到找到“坑爹”二字为止。这种搜索方法叫做顺序扫描法。对于少量的数据,使用顺序扫描是够用的。但是妈妈叫你查出坑爹的“坑”字在哪一页时,你要是从第一页的第一个字逐个的扫描下去,那你真的是被坑了。此时你就需要用到索引。索引记录了“坑”字在哪一页,你转载 2015-06-13 21:09:13 · 527 阅读 · 0 评论