针对海量审计日志统计分析的Amazon OpenSearch Service应用

bakencorn

已于 2023-11-07 10:30:38 修改

阅读量86

点赞数

文章标签： aws 数据库

于 2023-11-07 10:24:44 首次发布

本文链接：https://blog.csdn.net/bakencorn/article/details/134261242

版权

随着大模型的爆火，向量数据库也随之为大家所熟知。由于向量数据库专门针对高维向量数据的优化存储和高效检索，使得其能够有效地处理大规模的向量数据，并支持快速的相似性搜索和匹配操作，基于这些特点，在数据挖掘、深度学习、以及最近爆火的大模型领域广泛应用。
所谓向量数据，即是指以向量形式表示的数据，这些数据通常由多个维度组成，每个维度代表一个特征。像在自然语言处理中，我们可以将文本转换为向量数据，每个单词或词组的权重可以作为一个维度的值；又或者像在此次海量日志中，使用多个角度的信息(比如严重程度、时间、类型、IP地址、用户等等)作为维度的值。
本次应用针对的场景：前端设备针对特定事件所采集的图像/短视频后，连通发生的事件信息上报到中心服务器，本设备针对这些信息抓取其中关键信息审计存储及统计分析，因此流量巨大，一天至少达到上千万次，传统的SQL型数据库根本不可能满足要求，最初采用了云上的SQL型数据库做尝试，验证高并发写入时，瞬间就崩了，更不用说针对这些海量日志的统计分析。
因此针对这次业务的数据特点，项目组将视线转移到了向量数据库身上。恰巧上Amazon在2023.8.1日新更新发布了Amazon
OpenSearch Service，部署使用也很简洁方便
1.创建/登陆AWS账户。
2.选择部署类型，在最新版本中选择OpenSearch。在部署之前，您需要在亚马逊云科技管理控制台进行相应的设置。
3.根据用户指南在几分钟内构建和部署Amazon OpenSearch Service域。这样就可以顺利完成部署并开始使用Amazon OpenSearch Service。
由于其兼容支持 19 个版本的 Elasticsearch（1.5 至 7.10 版），以及 OpenSearch 和 Elasticsearch 绝大多数API，因此使用起来也很习惯。前期Demo阶段，直接预置了大量数据入库，以及使用了内置的kibana进行可视化。
实际进行开发阶段正在使用自研的可视化进行集成，同时在云端数据可以很方便的在客户现场给客户展示效果。官网描述支持多达 1.6 万维的向量匹配，并通过专门实现的 KNN 算法和分布式架构实现大规模向量的快速匹配和检索，集群的查询速率后续会进一步验证。

bakencorn

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
针对海量审计日志统计分析的Amazon OpenSearch Service应用

你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮助你用它写博客：撤销：Ctrl/Command + Z重做：Ctrl/Command + Y加粗：Ctrl/Command + B斜体：Ctrl/Command + I标题：Ctrl/Command + S
复制链接

扫一扫