和小白一起读paper
文章平均质量分 89
和小白一起读paper
小天才才
而世之奇伟、瑰怪,非常之观,常在于险远,而人之所罕至焉,故非有志者不能至也
展开
-
【自然语言处理】COLD:中文攻击性言论检测数据集
随着社交媒体的普及,网络上出现了大量的攻击性言论,这些言论不仅影响了网络环境的文明程度,也对使用预训练语言模型的应用带来了潜在的风险。因此,检测和过滤攻击性言论是一项重要的任务,也是自然语言处理领域的一个研究热点。然而,目前针对中文攻击性言论检测的研究还很少,主要原因是缺乏可靠的数据集。这篇文章提出了一个中文攻击性言论检测的基准测试——COLD,包括一个数据集和一个检测器。原创 2023-06-26 09:58:43 · 2363 阅读 · 1 评论 -
【日志解析】【频率分析】ULP:基于正则表达式和本地频率分析进行日志模板提取
日志文件包括大量关于软件系统执行的信息,用于帮助处理不同的软件工程活动,生成的日志事件主要由两部分组成:日志头和日志消息。解析日志消息需要自动区分静态文本和动态变量,一种方法是使用正则表达式,而典型的工业日志文件可能包含数百个日志模板,许多方法基于频率分析来实现,比如Drain和Logram,这些工具将频率分析应用于整个日志文件,这使得很难在静态和动态标记之间找到明确的界限。原创 2023-06-11 20:23:54 · 1260 阅读 · 0 评论 -
【日志解析】【启发式】Drain:一种用于日志解析的深度解析树
如今,越来越多的开发人员利用现有的Web服务来构建他们自己的系统,在此背景下,基于日志分析的服务管理技术,即利用服务日志来实现自动或半自动的服务管理,已经得到了广泛的研究。因此,应用数据挖掘模型来了解系统行为的日志分析技术被广泛应用于服务管理。在这些日志分析技术中使用的大多数数据挖掘模型都需要结构化的输入(例如,一个事件列表或一个矩阵)。但是,原始日志消息通常是非结构化的,因为开发人员可以在源代码中编写自由文本的日志消息。因此,日志分析的第一步是日志解析,其中非结构化日志消息被转换为结构化事件。原创 2023-06-07 23:53:12 · 1320 阅读 · 0 评论 -
【自然语言处理】【词嵌入】dLCE:将词汇对比集成到近义反义的词嵌入中
近义词与反义词是一中非常重要的语义关系,在nlp中应用广泛,由于它们在文本中可以互相替换着出现,所以区分它们颇具挑战。目前的方法认为具有相似分布的词汇有着相关的含义,于是倾向于构建词向量的方式来区分近义词与反义词。本文提出了新式的向量表示,提高预测词汇的相似度,对传统的分布式语义模型和词向量模型都有效。此方法通过使用词汇对比信息提高了权重特征的质量以区分同义词和反义词;结合词汇对比信息和skip-gram 模型预测相似、确定反义词。提高了权重特征的质量以区分同义词和反义词;原创 2023-04-04 23:18:51 · 606 阅读 · 0 评论 -
【深度学习】【语义分析】LogAnomaly:基于序列异常和定量异常的无监督学习的非结构化日志异常检测
发表会议:International Joint Conference on Artifificial Intelligence(CCF-A)发表时间:2019年关键词:日志异常检测、template2vec、序列/定量异常现有的自动日志异常检测方法使用索引而不是日志模板的语义,往往会导致误警报。在这项工作中,我们提出了LogAnomaly。原创 2022-10-04 16:46:47 · 2538 阅读 · 3 评论