搜索引擎
文章平均质量分 65
CrazyL-
记录学习点点滴滴,一次共勉
展开
-
IK分词工具
IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。在2012版本中,IK实现了简单的分词歧义排除算法,标志着IK分词器从单纯的词典分词向模拟语义分词衍化。原创 2023-01-20 17:52:55 · 1265 阅读 · 0 评论 -
索引查看工具Luke
Luke是用来查看Lucene、Solr、ElasticSearch索引的GUI工具,方便开发和诊断。原创 2023-01-20 17:29:32 · 357 阅读 · 0 评论 -
Lucene
lucene是一个全文检索的库,Solr是一个基于Lucene的全文搜索服务器。原创 2023-01-20 17:22:14 · 1676 阅读 · 0 评论 -
配置中文分析器
使用IKAnalyzer中文分析器。 分词器见我的资源 第一步:把IKAnalyzer2012FF_u1.jar添加到solr/WEB-INF/lib目录下。 第二步:复制IKAnalyzer的配置文件和自定义词典和停用词词典到solr的classpath下。 第三步:在schema.xml中添加一个自定义的fieldType,使用中文分析器<!-- IKAnalyzer--> <f原创 2017-06-26 21:57:40 · 385 阅读 · 0 评论 -
solrcore的schema.xml
schema.xml文件在SolrCore的conf目录下,它是Solr数据表配置文件,在此配置文件中定义了域以及域的类型还有其他一些配置,在solr中域必须先定义后使用<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" /> Name:域的名称 Type:域原创 2017-06-26 21:54:37 · 326 阅读 · 0 评论 -
多solrcore配置
配置多SolrCore的好处: 1. 一个solr工程对外通过SorlCore 提供服务,每个SolrCore相当于一个数据库,这个功能就相当于一个mysql可以运行多个数据库。 2. 将索引数据分SolrCore存储,方便对索引数据管理维护。 3. SolrCloud集群需要使用多core。复制原来的core目录为collection2,目录结构如下: 修改collection2原创 2017-06-26 21:35:47 · 995 阅读 · 0 评论 -
solr管理界面
主要说下solrcore的操作 通过此界面可以测试索引分析器和搜索分析器的执行情况。 注:solr中,分析器是绑定在域的类型中的。 可以定义数据导入处理器,从关系数据库将数据导入到Solr索引库中。 默认没有配置,需要手工配置 通过/update表示更新索引,solr默认根据id(唯一约束)域来更新Document的内容,如果根据id值搜索不到id域则会执行添加操作,如果找到则更新原创 2017-06-26 21:32:34 · 321 阅读 · 0 评论 -
solr部署
安装tomcat7x从solr解压包下的solr-4.10.3\example\webapps目录中拷贝solr.war值tomcat得webapps下完成solr.war得解压缩后删掉该文件添加solr服务的扩展依赖包(日志包) 把solr解压包下的solr-4.10.3\example\lib\ext目录下的所有jar包拷贝,复制到解压缩后的solr工程的WEB-INF\lib目录添加原创 2017-06-26 21:21:08 · 379 阅读 · 0 评论 -
SolrCore配置
SolrHome是Solr运行的主目录,该目录中包括了多个SolrCore目录。SolrCore目录中包含了运行Solr实例所有的配置文件和数据文件,Solr实例就是SolrCore。 一个SolrHome可以包括多个SolrCore(Solr实例),每个SolrCore提供单独的搜索和索引服务。 创建solrhome 拷贝solr目录到想要作为solrhome的目录下即可配置solrcor,原创 2017-06-26 21:13:49 · 2899 阅读 · 0 评论 -
solr下载及所需运行环境
考虑版本兼容性相关问题 下载: http://archive.apache.org/dist/lucene/solr/4.10.3/目录结构 bin:solr的运行脚本 contrib:solr的一些扩展jar包,用于增强solr的功能。 dist:该目录包含build过程中产生的war和jar文件,以及相关的依赖文件。 docs:solr的API文档 example:solr工程的例原创 2017-06-26 20:58:08 · 393 阅读 · 0 评论 -
solr介绍
什么是solr apache顶级开源项目,使用java开发、基于lucene的全文检索服务器 solr比Lucene提供了更多的查询语句,可扩展、可配置,同时对Lucene的性能进行了优化solr是如何实现全文检索的 索引流程:solr客户端(浏览器、java程序),可以向solr服务器发送post请求,请求内容是包含field等信息的一个xml文档,通过该文档,solr实现对索引的维护(增删原创 2017-06-24 16:03:55 · 412 阅读 · 0 评论 -
OpenResty入门
转载: https://openresty.org/cn/linux-packages.html安装CentOSsudo yum install yum-utilssudo yum-config-manager --add-repo https://openresty.org/package/centos/openresty.reposudo yum install openresty-res转载 2017-08-12 19:00:16 · 784 阅读 · 0 评论