程序设计领域:
指的是程序源代码被翻译成目标代码的过程中,生成二进制代码之前的过程。
网络安全数据:
源于数据不完整,拥有噪音,不一致,重复,高维度等方面。
1.数据清洗
过程: 进行格式转换,垃圾过滤,数据去重,格式清洗等操作
不完整数据,不一致数据,噪音数据
第一件事是检测偏差;
第二件事是数据规整;
2.数据集成
将若干个分散的数据源中的数据,逻辑的物理的集合在一个统一的数据集合中,
核心任务是将相互关联的分布式异构数据集成在一起,提供一个统一的数据接口。
3.数据规约
根据类型进行特征融合。
pre-processing(预处理)
最新推荐文章于 2025-03-16 16:12:20 发布