一、搜索引擎篇-揭开es神秘的面纱

一、es是什么?

       elasticsearch是一个开源的分布式、RESTful 风格的搜索和数据分析引擎,它的底层是开源库lucene。

二、lucene是什么?

最受欢迎的java开源全文搜索引擎开发工具包。 提供了完整的查询引擎和索引引擎, 部分文本分词引擎。

三、es中shard是什么?

一个index可能存储大量的数据,以至于一台机器放不下,即使能承载,用单机查询全量数据,也相当耗时。为了解决这个问题,es将index中的数据分成多份,每一份叫一个shard。

四、es中replica是什么?

replica即为shard的备份, 每个shard可以有多个replica, 其中一个是primary shard, 剩余的是replica shard。replica除可以起到容错的作用外, 还可以提高查询并发度。

五、lucene在es中的作用?

es的每个副本实际上是一个lucene index实例。

六、es集群结构:

                                  索引的六个分片被均匀分配到集群的三个节点中

1、名词解释:

     node代表机器节点

     P代表primary shard     主分片

     R代表replica shard      副分片

2、分片分配规则:

     2.1、让节点间均匀存储。

     2.2、保证不把主分片和副分片分配到同一个节点,避免单个节点故障引起数据丢失。

3、集群容灾:

      分布式系统难免出现故障,当节点异常时,es会自动处理异常节点。

      3.1、主节点异常:

               集群会重新选举主节点

      3.2、主分片异常:

               将副分片提升为主分片

七、为什么需要搜索引擎?

数据库适合结构化数据的精确查询,而不适合半结构化、 非结构化数据的模糊查询及灵活搜索(特别是数据量大时),无法提供想要的实时性。

结构化数据:用表、字段表示的数据

半结构化数据: xml、html

非结构化数据: 文本、 文档、 图片、 音频、 视频等

八、搜索引擎如何做到?

1、为什么称为倒排索引?

原名Inverted index, 失败地翻译成了倒排索引, 正确翻译为: 反向索引

2、索引可以合并在一起吗?

3、反向索引的记录数会不会很大?

    《牛津词典》 收词41万
           《现代汉语规范词典》 收录字数13000多个, 收录词数72000多个

     结论: 量不会很大, 100万以内; 通过这个索引找文章会很快。

4、如何建立这样一个索引?

 

5、java开源中文分词器有哪些?

    常用中文分词器有: IKAnalyzer          mmseg4j

6、分词时能不能统计出词的出现次数、 位置?

九、搜索

1、如何做才能快速查询到与“火锅” 有关的新闻?

      使用分词器对数据进行分词, 建立反向索引

2、有了反向索引了, 如何进行搜索?

      

3、合并后列表该如何排序?

         我们希望最相关的排在最前面

4、相关性如何度量?

         人可以通过读内容判定相关性,机器不懂人言,得需要一套能评估相关性的模型

5、如何根据次数建立一个相关性评估模型?

       规则1:统计出现次数,根据次数从高到底排序

       规则2:加入权重,标题权重10,内容权重1,计算权重得分,从高到底排序


 

  • 6
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Java8新特性及实战视频教程完整版Java 8 API添加了一个新的抽象称为流Stream,可以让你以一种声明的方式处理数据。Stream 使用一种类似用 SQL 语句从数据库查询数据的直观方式来提供一种对 Java 集合运算和表达的高阶抽象。Stream API可以极大提高Java程序员的生产力,让程序员写出高效率、干净、简洁的代码。这种风格将要处理的元素集合看作一种流, 流在管道中传输, 并且可以在管道的节点上进行处理, 比如筛选, 排序,聚合等。元素流在管道中经过中间操作(intermediate operation)的处理,最后由最终操作(terminal operation)得到前面处理的结果。 Lambda 表达式,也可称为闭包,它是推动 Java 8 发布的最重要新特性。Lambda 允许把函数作为一个方法的参数(函数作为参数传递进方法中)。使用Lambda 表达式可以使代码变的更加简洁紧凑。Java8实战视频-01让方法参数具备行为能力Java8实战视频-02Lambda表达式初探Java8实战视频-03Lambda语法精讲Java8实战视频-04Lambda使用深入解析Java8实战视频-05Lambda方法推导详细解析-上.wmvJava8实战视频-06Lambda方法推导详细解析-下Java8实战视频-07Stream入门及Stream在JVM中的线程表现Java8实战视频-08Stream知识点总结Stream源码阅读Java8实战视频-09如何创建Stream上集Java8实战视频-10如何创建Stream下集.wmvJava8实战视频-11Stream之filter,distinct,skip,limit,map,flatmap详细介绍Java8实战视频-12Stream之Find,Match,Reduce详细介绍Java8实战视频-13NumericStream的详细介绍以及和Stream之间的相互转换Java8实战视频-14Stream综合练习,熟练掌握API的用法Java8实战视频-15在Optional出现之前经常遇到的空指针异常.wmvJava8实战视频-16Optional的介绍以及API的详解Java8实战视频-17Optional之flatMap,综合练习,Optional源码剖析Java8实战视频-18初识Collector体会Collector的强大Java8实战视频-19Collector使用方法深入详细介绍-01Java8实战视频-20Collector使用方法深入详细介绍-02Java8实战视频-21Collector使用方法深入详细介绍-03.wmvJava8实战视频-22Collector使用方法深入详细介绍-04Java8实战视频-23Collector原理讲解,JDK自带Collector源码深度剖析Java8实战视频-24自定义Collector,结合Stream的使用详细介绍Java8实战视频-25Parallel Stream编程体验,充分利用多核机器加快计算速度Java8实战视频-26Fork Join框架实例深入讲解Java8实战视频-27Spliterator接口源码剖析以及自定义Spliterator实现一个Stream.wmvJava8实战视频-28Default方法的介绍和简单的例子Java8实战视频-29Default方法解决多重继承冲突的三大原则详细介绍Java8实战视频-30多线程Future设计模式原理详细介绍,并且实现一个Future程序Java8实战视频-31JDK自带Future,Callable,ExecutorService介绍Java8实战视频-32实现一个异步基于事件回调的Future程序.wmvJava8实战视频-33CompletableFuture用法入门介绍Java8实战视频-34CompletableFuture之supplyAsync详细介绍Java8实战视频-35CompletableFuture流水线工作,join多个异步任务详细讲解Java8实战视频-36CompletableFuture常用API的重点详解-上Java8实战视频-37CompletableFuture常用API的重点详解-下Java8实战视频-38JDK老DateAPI存在的问题,新的DateAPI之LocalDate用法及其介绍.wmvJava8实战视频-39New Date API之LocalTime,LocalDateTime,Instant,Duration,Period详细介绍Java8实战视频-40New Date API之format和parse介绍

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值