ES官网reference翻译文章(3)—Information out: search and analyze

对ES官网的reference的翻译,同时也是备忘,ES版本为7.5

下面是正文翻译,附上原文链接

https://www.elastic.co/guide/en/elasticsearch/reference/current/search-analyze.html

==================================================================================================

信息输出:搜索和分析

尽管你可以将ES当作文档存储库并检索文档和它们的元数据,ES真正的威力来源于能够轻易的获取基于Apache Lucene搜索引擎库的全套搜索能力。

ES提供了一个简单的、一致的REST API用于管理集群、索引和搜索数据。为了测试用途,你可以直接从命令行或者Kibana的开发者窗口(Developer Console)提交请求。从应用出发,你可以使用Java, JavaScript, Go, .NET, PHP, Perl, Python or Ruby的ES客户端。

搜索你的数据

ES REST API支持结构化查询、全文本查询以及结合这两者的复杂查询。结构化查询跟你在SQL中可以构造的查询类型相似。例如,你可以在employee索引中查询gender和age字段并且将匹配结果按照hire_date字段排序。全文本查询会找到所有匹配被查询字符串的文档并按照相关性(这些文档和你的搜索词条的匹配程度)将它们返回。

除了搜索单个词条,你可以实现词组搜索(phrase searches)、相似度搜索以及前缀搜索,并得到自动补全的建议。

想要搜索地理空间的或者其他数值的数据?ES将非文本的数据索引到优化的数据结构中,这种数据结构能够支持高性能的地理和数值查询。

你可以使用ES全面的JSON风格的查询语言来获得所有这些搜索能力,你也能构造SQL风格的查询来搜索和聚合ES内部的数据,JDBC和ODBC驱动使得大量第三方的应用可以通过SQL和ES交互。

分析你的数据

ES聚合(aggregations)能够让你对数据建立复杂的总结并且深入了解关键指标、规律和趋势。不同于仅仅实现“大海捞针”,聚合能够让你回答类似于下面的问题:

1)大海里的针有多少根?

2)针的平均长度是多少?

3)针的长度的中位数是多少?通过厂商区分

4)在过去六个月内每个月分别有多少针被投入了大海?

你也能使用聚合来回答更加微妙的问题,比如:

1)最流行的针制造商是什么?

2)是否有异常的针?

由于聚合利用的数据结构跟搜索使用的一样,聚合也非常快,这就能够让你实时分析和可视化你的数据,你的报告和dashboard随着你的数据变化而更新,你可以基于最新的信息采取行动。

此外,聚合在搜索请求的同时运行,你能够在一个请求里实现在相同的数据上搜索文档,过滤结果的同时完成分析。此外,由于聚合是在特定的搜索上下文中计算的,你不仅仅是展示所有70根针的size的数目,你是在展示与搜索准则(比如70个不锈钢针的size)相匹配的70根针的size的数目。

等等,还有更多

想要自动化你的时序数据的分析?你可以使用机器学习特性来创建数据正常行为的精确baseline并且识别异常模式。使用机器学习,你可以检测:

1)与值、计数或者频率的时间偏差相关的异常

2)统计稀有度

3)群体成员的异常行为

最好的部分?你不需要确定算法、模型或者其他数据科学相关的配置就能够完成这些。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值