一篇就懂,230页Elasticsearch大数据搜索引擎解读PDF

智慧生物的大规模协作造就了惊人的进化奇迹。大规模机器集群造就机器系统进化成为强大的智能系统。Elasticsearch作为大数据与搜索引擎技术的结合体,随着社会对大规模开源分布式搜索引擎的需求迅速成长!

本篇文章从基本概念开始熟悉Elasticsearch,接下来介绍了Elasticsearch在 Windows和Linux操作系统下的安装。除了CURL命令,介绍了使用常用的编程工具和Elasticsearch 搜索服务交互,包括Java、Python、Scala和 PHP,以及使用SQL语句查诲Elasticsearch 索引的方法。自然语言文本理解往往以插件形式存在于Elasticsearch集群中。

第2章介绍了如何开发与测试插件。因为 Elasticsearch经常用于实时搜索或分析,所以性能优化很重要。第3章介绍了如何管理 Elasticsearch 集群。为了更合理地使用和扩展Elasticsearch,第4章简单分析了 github 中托管的Elasticsearch源代码。对于搜索引擎来说,返回结果的相关性是一个重要的话题,第5章讨论了这个问题。第6章介绍了使用Java开发搜索引擎Web 用户界面的几种方法。

随着人工智能领域技术的发展,让搜索引擎智能加速变成现实。智能搜索引擎需要能够检测到并识别出图像中的文字,第7章介绍了结合OpenCV使用Tesseract 识别文字的方法第8章介绍了根据问题返回搜索结果的问答式搜索。目前 Elasticsearch是实时系统监控的首选,第9章介绍了使用Elasticsearch 监控与分析日志,也介绍了通过物联网监控系统的方案

因为文章篇幅问题,以下就展示了部分截图,需要全文PDF文档的小伙伴点击文末下方传送门即可免费获取完整pdf!

第1章 使用Elasticsearch

86fc2224560afd5640c87353c1467e7c.jpeg

  • 1.1 基本概念
  • 1.2 安装
  • 1.3 搜索集群
  • 1.4 创建索引
  • 1.5 使用Java客户端接口

00569e1861ac014e3b05769a8e08b7a3.jpeg

  • 1.6 RESTClient
  • 1.7 使用Jest
  • 1.8 Python客户端
  • 1.9 Scala客户端
  • 1.10 PHP客户端
  • 1.11 SQL支持
  • 1.12 本章小结

第2章 开发插件

  • 2.1 搜索中文
  • 2.2 搜索英文
  • 2.3 使用测试套件
  • 2.4 本章小结

bcbcba902944b80176f12db73d8581fe.jpeg99c90bea8e87352156119a98ec285021.jpeg

第3章 管理搜索集群

  • 3.1 节点类型
  • 3.2 管理集群
  • 3.3 写入权限控制
  • 3.4 使用X-Pack
  • 3.5 快照
  • 3.6 Zen发现机制
  • 3.7 联合搜索
  • 3.8 缓存
  • 3.9 本章小结

21ee3b0966a0e66e87777d0e67ec5262.jpeg8a4c46be83f6f51254d150a84d361258.jpeg

第4章 源码分析

  • 4.1 Lucene源码分析
  • 4.2 Gradle
  • 4.3 Guice
  • 4.4 Joda-Time
  • 4.5 Transport
  • 4.6 线程池
  • 4.7 模块
  • 4.8 Netty
  • 4.9 分布式
  • 4.10 本章小结

021d06fd3f62ab0af1bb4ccde3abc59c.jpegb68a6eb063859485459c203c96fdfa0f.jpeg

第5章 搜索相关性

  • 5.1 BM25检索模型
  • 5.2 学习评分

0674ef0a650d680c9802e03779edcab7.jpeg2d0c5372eee219bdb90248f202a80cb4.jpeg

第6章 搜索引擎用户界面

  • 6.1 JSP实现搜索界面
  • 6.2 使用Spring实现的搜索界面
  • 6.3 实现搜索接口
  • 6.4 实现相似文档搜索
  • 6.5 实现AJAX搜索联想词
  • 6.6 推荐搜索词
  • 6.7 查询意图理解
  • 6.8 集成其他功能
  • 6.9 查询分析
  • 6.10 部署网站

1e81a1aa3cc776dd1f36b91779be5111.jpegfdbf567dfcf223ae4ccf9ddbe3b413df.jpeg

第7章 OCR文字识别

  • 7.1 Tesseract
  • 7.2 使用TensorFlow识别文字
  • 7.3 OpenCV
  • 7.4 JavaCV
  • 7.5 本章小结

5ab6596db4204ea5d912cab074f5cba9.jpegf941a30a684326193352d2dfa8a83ed8.jpeg

第8章 问答式搜索

  • 8.1 生成表示语义的代码
  • 8.2 信息整合
  • 8.3 自动问答
  • 8.4 本章小结

bfebcc96d1cc6c43272aefd61ad39ff9.jpeg3d3ef327331cdbc8a0cd4bf459373d5a.jpeg

第9章 Elastic系统监控

  • 9.1 Logstash
  • 9.2 Filebeat
  • 9.3 消息过期
  • 9.4 Kibana
  • 9.5 Flume
  • 9.6 Kafka
  • 9.7 Graylog
  • 9.8 物联网数据
  • 9.9 本章小结

a6e549c693cb3f99d73ae6d33378692c.jpeg7c425f1d6151e761ce9e3e35c0a874af.jpeg

因为文章篇幅问题,以下就展示了部分截图,需要全文PDF文档的小伙伴点击文末下方传送门即可免费获取完整pdf!!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值