机器学习小组知识点26：数据预处理之数据规约（Data Reduction）

最新推荐文章于 2024-07-16 06:44:35 发布

Eric2016_Lv

最新推荐文章于 2024-07-16 06:44:35 发布

阅读量3.5k

点赞数 1

分类专栏：机器学习数据挖掘文章标签：数据压缩数据分析

本文链接：https://blog.csdn.net/Eric2016_Lv/article/details/53487700

版权

数据归约是应对大数据分析时间长的有效策略，包括维归约、数据压缩和数值归约。维归约通过删除不相干属性减少数据量，常用方法有属性子集选择和判定归纳树。数据压缩涉及有损和无损压缩，如字符串压缩和音频/视频压缩，而主成分分析是常用的数据降维技术。数值归约则通过参数模型和无参方法减少数据表示形式。主成分分析是降低数据维度的重要手段，常用于数据预处理。

摘要由CSDN通过智能技术生成

数据归约策略

数据仓库中往往具有海量的数据，在其上进行数据分析与挖掘需要很长的时间

数据归约
用于从源数据中得到数据集的归约表示，它小的很多，但可以产生相同的（几乎相同的）效果

数据归约策略
维归约
数据压缩
数值归约
离散化和概念分层产生

用于数据归约的时间不应超过或“抵消”在归约后的数据上挖掘节省的时间