目录
==
主要内容
====
第1章介绍了如何使用elasticsearch,在信息时代,可供获取的数据加速涌现,我们可以通过搜索引擎来挖掘大数据的价值,百度就是一个大的数据搜索引擎。
Lucene是一个Java 语言开发的开源全文检索引擎工具包。Lucene 穿了一件json的外衣,就是Elasticsearch。 Elasticsearch 内置了对分布式集群和分布式索引的管理,所以相对Solr来说,更容易分布式部署。
第2章介绍了如何开发与测试插件。因为Elasticsearch经常用于实时搜索或分析,所以性能优化很重要。
第3章介绍了如何管理Elasticsearch 集群。默认Elasticsearch是使用Netty作为HTTP的容器的,由于Netty并没有权限模块,所以默认Es没有任何的权限控制,直接通过HTTP就可以进行任何操作,除非把HTTP禁用。但如果使用elasticsearch-jetty 插件,就可以使用jetty自带的权限管理进行一些权限的控制,同时也可以支持通过HTTPS协议来访问Es,还有就是支持gzip压缩响应信息。
为了更合理地使用和扩展Elasticsearch,第4章简单分析了github 中托管的Elasticsearch 源代码。
对于搜索引擎来说,返回结果的相关性是一个重要的话题, 第5章讨论了这个问题。评估查询词和文档的相关性当前有BM25检索模型和学习评分两种流行的方法。
第6章介绍了使用Java开发搜索引|擎Web用户界面的几种方法。搜索相关页面主要包括首页和搜索结果页。如果用户输入搜索词是空,则可以显示一个对信息分类导航的页面。首页主要包含搜索条区域,此外可以包括一些推荐信息, 以及当.前热门信息。
对于互联网搜索来说,搜索结果界面往往采用JSP 或ASP.NET、 PHP、Python 等技术来实现。搜索联想词的页面效果可以用Ajax来实现。
这里首先介绍采用JSP和自定义标签实现的搜索界面,然后介绍REST架构的搜索界面。
随着人工智能领域技术的发展,让搜索弓|擎智能加速变成现实。智能搜索引|擎需要能够检测到并识别出图像中的文字,第7章介绍了结合OpenCV使用Tesseract 识别文字的方法。
最后
针对最近很多人都在面试,我这边也整理了相当多的面试专题资料,也有其他大厂的面经。希望可以帮助到大家。
下面的面试题答案都整理成文档笔记。也还整理了一些面试资料&最新2021收集的一些大厂的面试真题(都整理成文档,小部分截图)
最新整理电子书
图片转存中…(img-2rje2O9M-1720122025458)]
最新整理电子书
[外链图片转存中…(img-SYhmpn4c-1720122025459)]