搜索引擎入门
文章平均质量分 84
爆裂码手
I thought coding was easy.
展开
-
在Linux环境下安装部署ElasticSearch过程整理
准备一个Linux系统我这里在虚拟机上装了一个 CentOS-7-x86_64-Minimal-1708.isonet-tools安装由于此版本的系统在ifconfig无法执行,所以安装net-tools yum install net-tools关闭防火墙firewallsystemctl stop firewalld.service #停止fir...原创 2018-04-27 15:39:55 · 541 阅读 · 1 评论 -
作为一个Java开发你可以学会的【搜索】技术
对于搜索引擎,我想处于互联网时代的你一定不会对此感到陌生,而关于搜索的原理和使用,作为一个Java开发,你可能需要了解,并且是可以学会轻量使用的。对于搜索的使用,用起来是非常容易的,现如今,基于Lucene的Solr和ElasticSearch搜索引擎使用起来非常方便。但是对于原理你可能就半知半解了。我最近整理并写了一些关于搜索入门的博客,我想,通过我的这些博客,你是可以一点一点得去了解搜索技术的原创 2018-01-04 21:24:37 · 3022 阅读 · 0 评论 -
搜索学习基础--分词器的使用
在代码实现倒排索引这节中,我们的分词方式是对文本按空格分词。而在我们实际过程中,我们对分词的要求是苛刻的,我们会在不同的场景下使用不同的分词器。现在,我们先使用标准分词器StandardAnalyzer这个工具来进行分词的测试。首先我们需要引入jar包,这是一个Lucene全文检索引擎中自带的分词器. org.apache.lucene luc原创 2017-11-09 21:19:37 · 685 阅读 · 0 评论 -
搜索学习--Lucene中搜索的排序、范围区间搜索、分页搜索、多条件搜索
依赖 <!-- Lucene核心 --> <dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-core</artifactId> <version>4.7.2</version>原创 2017-11-28 10:20:39 · 1032 阅读 · 0 评论 -
搜索学习--Solr全文搜索服务器的基本使用(二)——Spring Data Solr的使用
在上一篇搜索学习–Solr全文搜索服务器的使用(一)——SolrJ的使用中,我是直接使用的SolrJ来调用Solr服务器的,而对于熟悉Spring Data系列的同学一定更希望用这种规范的方式去操作它。Spring Data是支持Solr的,只需要简单的配置,我们即可像操作数据库一样操作它。依赖 <properties> <spring-version>4.2.3.RELE原创 2017-12-06 14:43:00 · 3468 阅读 · 0 评论 -
搜索学习--Solr全文搜索服务器的基本使用(一)——SolrJ的使用
作为一般的Lucene使用者,我们直接用Lucene虽然可以实现很多自己想要的自定义功能,但是对于一般的项目,为了方便开发和维护,我们通常会使用现成的搜索服务器。现在常用的有Solr和ElasticSearch。 对于Solr服务器如何搭建,Solr服务器的搭建,之前已经整理过,这次,我将使用SolrJ来调用Solr服务器。在Solr中配置Core 在managed-schema中,主要原创 2017-12-06 14:16:42 · 1370 阅读 · 0 评论 -
搜索学习--Solr服务器的搭建与使用
solr服务器的搭建与使用,我们尝试着建立一个索引.之前用过Lucene的同学应该知道,我们建立一个索引是需要Document和Field的,而这些Field呢,在Solr中可以在managed-schema中配置我们先打开刚刚建立的solrCore 目录中的solrHome\myCore\conf\managed-schema原创 2017-07-04 09:39:43 · 3039 阅读 · 0 评论 -
搜索学习--Elasticsearch全文搜索服务器的基本使用
前言之前我们使用Solr全文搜索服务器来建立我们自己的搜索,本篇文章将介绍跟Solr类似的另一种搜索服务器——Elasticsearch。就个人而言,Elasticsearch比Solr使用更方便,完全Http+Json也可以去使用。对于ElasticSearch服务器的部署,分布式,集群这里就先不介绍了。部署启动后,访问 http://127.0.0.1:9200/,显示如下类似信息,说明服务器已原创 2017-12-11 11:44:01 · 4513 阅读 · 1 评论 -
搜索学习基础--代码模拟倒排索引过程
代码模拟倒排索引过程原创 2017-10-31 19:25:29 · 1074 阅读 · 0 评论 -
搜索学习基础--倒排索引的过程解读
Doc1: He is a coder,and she is a coder too. Doc2:Json is a doctor,but he was a coder.第一步:获取关键词keywordsa:分词(按空格分词): Doc1: [He] [is] [a] [coder],[and] [she] [is] [a] [coder] [too] Doc2:原创 2017-10-31 09:50:17 · 5983 阅读 · 0 评论 -
搜索学习入门--Lucene初体验(Lucene索引的增删改查)
Lucene是一个开放源代码的全文检索引擎工具包,它提供了完整的查询引擎和索引引擎,开发人员可以方便的在目标系统中实现全文检索。Lucene的核心使用的是基于倒排索引的,并且实现了实现了分块索引。下面,先来体验一下Lucene的基本功能:全文索引的建立与全文检索。第一步:引入依赖<!-- Lucene核心 --><dependency> <groupId>org.apache.lucen原创 2017-11-13 21:39:48 · 780 阅读 · 0 评论 -
搜索学习入门--使用LuceneHighlighter高亮显示Lucene检索结果的关键词
在上一篇文章搜索学习入门–Lucene初体验(Lucene索引的增删改查)d的基础上,我们进行对Lucene检索结果的高亮显示。第一步:在增加Lucene高亮模块依赖<dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-highlighter</artifactId> <version>4.原创 2017-11-21 15:43:36 · 2249 阅读 · 0 评论 -
基于TextRank算法提取关键词——Java实现
TextRank算法 提取关键词原创 2017-11-03 16:33:42 · 10078 阅读 · 1 评论 -
搜索学习基础--基本概念的简单阐述
关于查询查询数据分为精确查找和模糊查找 精确查找:对于精确查找,我们都非常熟悉,就是这个值必须等于这个条件。比如我们常用的数据库查询中: select * from user_info where user_id = ? 模糊查找:对于模糊查找,我们需要查找的范围就是结果中的某个值必须包含这个条件。平时我们在一个文档中查找某个 单词,这就是模糊查找。 对于普通的查找,原创 2017-11-09 20:13:15 · 1029 阅读 · 0 评论 -
在Linux环境下搭建ElasticSearch集群
前提准备能在Linux中成功运行单机的ElasticSearch服务搭建概要本次试验实3台机器上分别部署一个ElasticSearch服务做成集群elasticsearch.yml配置############ES1###############cluster.name: my-applicationnode.name: node-1network.host: 192....原创 2018-04-27 15:43:16 · 934 阅读 · 0 评论