自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (1)
  • 收藏
  • 关注

原创 搜索的相关性问题

想让搜索引擎工作正常可能是一件令人抓狂的事。无论你是刚开始使用solr或者Elasticsearch的新手,还是具备多年经验的熟手,都有可能在质量低劣的搜素结果里苦苦挣扎过。一提到相关性排名,搜索引擎就有点像一个神秘的黑盒。...

2019-10-25 19:36:42 753

转载 电商搜索架构

本文来自于前当当网高级架构师吴英昊在OneAPM 技术公开课的演讲整理。吴英昊对电商搜索引擎的架构进行了深入分享,就电商搜索引擎的特点进行了解析,分享了电商搜索引擎的架构、数据更新、故障恢复等多个方面的内容。本文转自:CSDN,作者:吴英昊。点击 阅读原文 查看网页版文章。首先,我想说的是电商搜索引擎和普通的搜索引擎有很大的差别,因为电商搜索引擎主要是解决用户要“买什么”,而通用搜索引擎主要是...

2019-10-25 19:03:25 1225

概念原理.md

elasticsearch 简单介绍 在分布式系统中,单机无法存储规模巨大的数据,水平扩容增加机器来提高扩展能力,因此,需要把数据分成若干小块分配到各个机器上,然后通过某种策略找到某个数据块所在的位置 在分布式系统中,会把数据复制成多个副本,放置到不同的机器中,增加系统的可用性,同时数据副本还可以使度操作并发执行,分担集群压力。但多副本带来的问题是数据一致性 ES 将数据副本分成主从两份,主分片和副分片,恢复阶段以主分片为准 分片是底层的基本读写单元,分片的目的是分割巨大索引,让读写可以并行操作,分片是数据的容器,文档保存在分片内,不会跨分片存储。分片又被分配到集群内的各个节点里。当集群规模扩大或缩小时,ES 会自动在各节点中迁移分片,使数据仍然均匀分布在集群 一个 ES 索引包含很多分片,一个分片是一个 Lucene 的索引,它本生就是一个完整的搜索引擎,可以独立执行建立索引和搜索任务。Lucene 索引又由很多分段组成,每个分段都是一个倒排索引。ES 每次 “refresh” 都会生成一个新的分段,其中包含若干文档的数据。在每个分段内部,文档的不同字段被单独建立索引。每个字段的值由若干词(Term)组成,Term 是原文本内容经过分词器处理和语言处理后的最终结果(例如,去除标点符号和转换为词根)

2019-10-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除