![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数仓
文章平均质量分 82
Hokpoo2020
这个作者很懒,什么都没留下…
展开
-
数据仓库学习笔记(二)
《数据仓库与数据挖掘教程》–黄德才数据挖掘和分析数据的属性与相似值数据集的结构1、二维表[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sW9NxSBY-1627637786028)(C:\Users\Alger\Desktop\数仓学习\数据仓库学习笔记(二).assets\image-20201026163119475.png)]2、数据矩阵[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mRkXGyDo-162763778603原创 2021-07-30 17:38:45 · 716 阅读 · 0 评论 -
数据仓库学习笔记
《数据仓库与数据挖掘教程》–黄德才数据仓库多源数据问题1、数据不一致:多个数据源抽数并集成得到的同一数据可能不一致2、数据属性差异:同一含义的数据在不同数据源中用了不同类型、长度或者量纲来描述3、数据重复:一个数据可以通过其他若干数据计算得到4、数据不完整5、噪声数据:测量数据时遇到的随机或其他不确定性干扰因素,导致被测量的数据产生了偏差或错误6、高维数据:即多余的属性7、模式不统一:即将集成为单一数据集的两个或多个数据源的模式不同,就称为模式不统一8、数据不平衡:某一类样本的数量明显少原创 2021-07-30 17:36:08 · 4458 阅读 · 0 评论