开源数据的质量评估指标体系研究

本文研究了开源数据质量评估体系,针对其不确定性、欺骗性等问题,提出多维度评估理论和跟踪方法,旨在提升数据实效性、完整性、关联性,支持网络安全分析。文章分析了现有问题,包括缺乏评估体系、识别困难、量化评估挑战和质量问题闭环,构建了数据置信度、核查、价值度、综合质量和专采数据核准等评估类型。
摘要由CSDN通过智能技术生成

摘 要

开源数据是网络威胁检测、网络威胁情报、网信治理和网络安全态势感知的重要数据来源。开源数据具有实时性、海量性、虚假性等特点,其数据质量主要是指数据的固有属性能否满足用户的需求,数据质量低的开源数据会导致分析的准确性降低,影响后续决策。因此,开源数据质量评估是影响开源数据分析与利用的重要难题,基于开源数据特征提出了数据质量评估体系,构建全面实用的开源数据质量维度、评估理论、跟踪方法,增加了开源数据的实效性、完整性、关联性,释放数据价值,提升网络安全事件分析、溯源处置的及时性、准确性。

内容目录:

1 国内外现状

2 开源数据质量评估体系

2.1 开源数据质量评估体系

2.2 开源数据多维质量检测指标构建

3 开源数据质量评估流程

4 结 语

开源数据是指在开放环境下,通过合法方法从公开资料中获取的数据,数据可被任何人自由访问、重复使用与共享,没有版权、专利或其他限制。

随着互联网、大数据技术的快速发展,网络环境中的开源数据量井喷式增长,占据数据体量的 95%。开源数据具备类型多样、及时性、开放性、海量多维等特点,为开源数据的深度分析与挖掘提供了坚实的数据基础。但是开源数据的多源异构、无组织管理、碎片化等特点,让人们无法对数据进行多维度评估,使得数据本身的不确定

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

米朵儿技术屋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值