自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

原创 es搜索核心与实战Day08

es搜索核心与实战Day08一、分页于遍历1.From/Size默认情况下,查询按照相关度算分排序,返回前十条记录容易理解的分页方案From:开始位置Size:期望获取文档的总数2.Search After避免深度分页问题避免深度分页的性能问题,可以实时获取下一页文档信息不支持指定页数(From)只能往下翻第一步搜索需要指定sort,并保证值是唯一的(可以通过加入_id保证唯一性)然后使用上一次,最后一个文档的sort值进行查询POST tmdb/_se

2020-07-09 12:31:25 219

原创 es搜索核心与实战Day07

es搜索核心与实战Day071.文档到分片的路由算法shard=hash(_rounting)%number_of_primary_shards​ Hash算法确保文档均匀分散到分片中​ 默认的_routing 值是文档id​ 可以自行制定routing数值,例如用相同国家的商品,都分配到指定的shard​ 设置Index Setting后,Primary数,不能随意修改的更本原因更新一个文档2.分片及其生命周期a.倒排索引的不

2020-07-01 12:38:14 176

原创 es搜索核心与实战Day06

es搜索核心与实战Day06一、分布式特性Elasticsearch的分布式架构带来的好处1.存储的水平扩展,支持PB级数据提高系统的可用性,部分节点停止服务,整个集群的服务不受影响Elasticsearch的分布式架构1.不同的集群通过不过的名字来区分,默认名字“elasticsearch”2.通过配置文件修改,或者在命令行中 -E cluster.name=geektime设定二、Coordinating Node处理请求的节点,叫Coordinating Nod

2020-06-23 18:11:07 163

原创 es搜索核心与实战Day05

es搜索核心与实战Day05一、相关性和相关性算分相关性 一Relevance搜索的相关性算分,描述了一个文档和查询语句匹配的程度。ES会对每个匹配查询条件的结果进行算分_score打分的本质是排序,需要把最符合用户需求的文档排在前面。ES 5之前,默认的相关性算分采用TF-IDF,现在采用BM 251.词频TFTerm Frequency: 检索词在子篇文档中出现的频率检索词出现的次数除以文档的总字数度量一条查询和结果文档相关性的简单方法: 简单将搜索中每一一个词的TF进行相力

2020-06-23 18:09:29 171

原创 es搜索核心与实战Day04

es搜索核心与实战Day041.Index TemplateIndex Templates -帮助你设定Mappings和Settings, 并按照一-定的规则,自动匹配到新创建的索引之上a.模版仅在一个索引被新创建时,才会产生作用。修改模版不会影响已创建的索引​ b.你可以设定多个索引模版,这些设置会被“merge"在一 起​ c.你可以指定 “order”的数值,控制“merging’ 的过程//Create a default templatePUT _t

2020-06-23 18:09:11 176

原创 es搜索核心与实战Day03(Mapping)

es搜索核心与实战Day03(Mapping)一.MappingMapping类似数据库中的schema的定义,作用如下​ 1. 定义索引中的字段的名称​ 2.定义字段的数据类型,例如字符串,数字,布尔…​ 3.字段,倒排索引的相关配置,(Analyzed or Not Analyzed,Analyzer)Mapping 会把JSON文档映射成Lucene所需要的扁平格式一个Mapping属于一个索引的Type

2020-06-20 09:31:57 200

原创 es搜索核心与实战 Day02

es搜索核心与实战 Day02一、倒排索引1.搜索引擎正排索引——文档ld到文档内容和单词的关联+倒排索引——单词到文档Id的关系2。倒排索引的核心组成倒排索引包含两个部分单词词典 (Term Dictionary), 记录所有文档的单词,记录单词到倒排列表的关联关系​ 单词词典一般比较大,可以通过B +树或哈希拉链法实现,以满足高性能的插入与查询倒排列表(Posting List) - 记录了单词对应的文档结合,由倒排索引项组成​ 倒

2020-06-15 18:39:12 168

原创 logstach安装

logstach安装1.Logstash下载安装Logstash官网:https://www.elastic.co/cn/downloads/logstashLogstash版本号要和Elasticsearch对应解压tar -zxvf logstash-7.6.2.tar.gz -C /opt/module/进入logstash下的bin目录,创建logstash.conf文件添加配置input { file { #指定所要的数据文件路径 path => "/opt/mo

2020-06-13 20:59:26 815

原创 在CentOS7虚拟机上,es搜索安装过程以及kibana的安装。

在CentOS7虚拟机上,es搜索安装以及kibana的安装。(1)elasticsearch7的安装首先在es官网下载安装包连接:https://www.elastic.co/cn/elasticsearch/解压:tar -zxvf elasticsearch-7.7.1-linux-x86_64.tar.gz / /+你自己选择的文件夹路径(或tar -zxvf elasticsearch-7.7.1-linux-x86_64.tar.gz 后mv elasticsearch- 7.x.

2020-06-12 12:32:54 541

原创 es搜索核心与实战 Day01

es搜索核心与实战 Day01文档Elasticsearch 是面向文档的,文档是所有可搜索数据的最小单位日志文件中的日志项​一本电影的具体信息 / 一张唱片的详细信息​MP3播放器里的一首歌 / 一篇PDF文档中的具体内容文档会被序列化成JSON格式,保存在Elasticsearch中JSON对象由字段组成,每个字段都有对应的字段类型(字符串/数值/布尔/日期/二进制/范围类型)每个文档都有一个 Unique ID你可以自己指定 ID​或者通过Elastic

2020-06-12 11:03:04 259

movies.csv

电影csv数据es搜索导入数据包用于数据处理及搜索,

2020-06-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除