搜索引擎
Unkown630
这个作者很懒,什么都没留下…
展开
-
Solr学习笔记
准备:Tomcat版本:apache-tomcat-7.0.0Solr版本:apache-solr-1.4.1开始:解压apache-solr-1.4.1.zip包,解压开目录结构如下:[img]http://dl.iteye.com/upload/attachment/280045/fd73c825-abc0-3137-8586-0baf3ee947bc.jpg[/img] ...原创 2010-10-30 16:13:26 · 90 阅读 · 0 评论 -
(转)Solr笔记 Schema.xml和solrconfig.xml分析
现在我们开始研究载入的数据部分(importing data)在正式开始前,我们先介绍一个存储了大量音乐媒体的网站http://musicbrainz.org ,这里的数据都是免费的,一个大型开放社区提供。MusicBrainz每天都提供一个数据快照(snapshot)的SQL文件,这些数据可以被导入PostgreSQL数据库中。一、字段配置(schema)...原创 2010-11-08 15:39:59 · 118 阅读 · 0 评论 -
hibernate search和solr的企业级搜索
[size=medium]最近刚忙完一个电影网站,其中的全文搜索的功能我就是用Solr完成的,在此将我在开发中遇到的问题以及怎样解决问题的经验拿出来与大家分享。 我们这个网站有一个站内搜索的功能,例如站内新闻,输入关键字去搜索。数据库里有上万条数据,如果去挨个like,效率会很低,经领导指点,说可以试一试HibernateSearch和Apache solr结合mmseg4j分词进行全文...原创 2010-11-08 15:02:02 · 179 阅读 · 0 评论 -
nutch-乱码解决(转)
ubuntu下nutch-1.0的安装和配置错误排除(原创) 国内部份建立在云计算之上的网站nutch-乱码解决搜索引擎与人工智 2009-05-13 12:02:49 阅读75 评论0 字号:大中小 订阅 在Nutch的搜索框中输入中文,点击“搜索”按钮之后,可以看到搜索框中的关键字是乱码,搜索结果也为空。网上有很多文章都谈到了这个现象,这不是Nutch的问题,而是T...原创 2011-06-02 00:45:01 · 149 阅读 · 0 评论 -
nutch 抓取动态网页(转)
解决搜索动态内容的问题:需要注意在conf下面的2个文件:regex-urlfilter.txt,crawl-urlfilter.txt# skip URLs containing certain characters as probable queries, etc.-[?*!@=] (-改+)这段意思是跳过在连接中存在? * ! @ = 的页面,因为默认是跳过所以,在动态页中存...原创 2011-06-02 00:38:02 · 165 阅读 · 0 评论 -
solr的分布式部署
[size=medium]需求:实现SOLR主,辅服务器更新同步,每次客户端COMMIT请求都会及时应用在辅服务器上。 实现MULTICORE,实际生产环境中往往会有多个搜索应用实例。 步骤:一、 准备条件服务器准备 准备两台服务器:一台用作主服务器(192.168.0.36),负责分发索引另一台负责辅...原创 2010-11-03 20:30:03 · 134 阅读 · 0 评论 -
在Tomcat中使用solr
====== ========== 单个 Solr App ==== * 下载和安装 [[http://tomcat.apache.org/|Tomcat]],Windows 用 MSI 安装。用 tcnative.dll 文件安装它,可以安装到 C:\tomcat 目录。((chenlb注:其实可以用*.zip直接解压就得了)) * 检查安装是否正确,[[htt...原创 2010-11-03 19:32:32 · 131 阅读 · 0 评论 -
solr技术文档
[quote="pan_java"]SOLR技术文档1. 了解lucene 原理,全文搜索概念,参考([url]http://wishlife.iteye.com/category/30179[/url]) .建立自己的索引库.2. 了解solr参考([url]http://www.ibm.com/developerworks/cn/java/j-solr1/[/url], [url]ht...原创 2010-11-03 19:25:28 · 86 阅读 · 0 评论 -
solr二次开发之solrj(转载)
[size=medium]Solrj已经是很强大的solr客户端了。它本身就包装了httpCliet,以完全对象的方式对solr进行交互。很小很好很强大。 不过在实际使用中,设置SolrQuery 的过程中,为了设置多个搜索条件和排序规则等等参数,我们往往会陷入并接字符串的地步,实在是很丑陋,不符合面向对象的思想。扩展性几乎为0,。基于这点,开发了一个小东西,我们只需要设置搜索对象,将对...原创 2010-11-02 20:59:48 · 230 阅读 · 0 评论 -
Solr在TomCat下的使用 和 运行多个Solr (转)
一、在Tomcat中安装运行Solr下载Solr包,找到dist文件夹中的appache-solr-1.4.0.war。将它拷贝到tomcat的webapps下,改名为solr.war(之后访问的路径为/solr)。在webapp下建立同war包名一样的文件夹(这里就是solr),将example/solr下的所有文件拷贝到这个目录下(这里是一些样例的配置)在tomcat的conf...原创 2010-11-08 15:55:43 · 168 阅读 · 0 评论