学习笔记4：日志异常检测之特征提取

最新推荐文章于 2024-08-11 23:25:18 发布

疯狂的小羊肖恩

最新推荐文章于 2024-08-11 23:25:18 发布

阅读量2.2k

点赞数 20

分类专栏：深度学习编程文章标签：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hyq99999/article/details/135598564

版权

本文详细介绍了日志异常检测中的特征提取过程，特别是如何使用自然语言处理技术对日志键和参数进行编码，以便于深度学习模型处理。涉及的方法包括日志键的顺序编号编码和参数的预处理与分词编码。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、特征提取

日志异常检测任务一般分为日志采集、日志解析、特征提取、异常判别4个步骤
特征表示/提取这部分工作的主要目的在于构造机器学习模型可以处理的特征数据，借此来学习日志的正常或者异常模式。所提取特征的质量决定了后续模型检测效果所能达到的精度。
特征提取的输入是日志解析步骤中生成的日志事件，输出的是事件计数矩阵。
日志特征提取技术有：基于自然语言处理NLP，基于规则集，基于统计模型。这里我采用的是基于自然语言处理NLP

二、具体实现步骤（参考文章）

在日志解析完成后，我们已经得到系统的结构化日志，但是此时日志键还只是字符串的形式，参数列表元素也还是字符串，无法直接作为深度学习模型的输入，所以我们还需要将其特征化为数字形式的特征向量。特征提取的过程就是将字符串中转换为可量化的数字，从而构造矩阵作为特征向量，对于日志键和参数，由于其形成和表达的意义不同，我们采用了两种不同的特征化方法。

最低0.47元/天解锁文章

疯狂的小羊肖恩

博客等级

码龄3年

25
原创

300
点赞

341
收藏

194
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

学习笔记4：日志异常检测之特征提取
troy002: 看了原文，原文说的日志键，跟作者说的不一样哦：每一行日志都是源代码的输出语句生成的。比如某个进程的源代码中的日志打印语句为printf("Accepted password for %s from %s port %d ssh2 \n", user, host, port)，那么在程序的运行过程中，就可能会产生Feb 28 04:48:54 combo sshd(pam_unix)[6741]: Accepted password for root from 112.64.243.186 port 2371 ssh2。一条源代码打印出的日志为同一类型，其代码称为日志键。
背包问题+CTF实例
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
背包问题+CTF实例
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
DASCTF2024暑期挑战赛|为热爱，并肩作战
疯狂的小羊肖恩: 还没有，还在学习中
DASCTF2024暑期挑战赛|为热爱，并肩作战
Zue3r: EasyJob有题解了么师傅

最新文章

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。