数据挖掘导论
文章平均质量分 94
逃离地球去流浪
这个作者很懒,什么都没留下…
展开
-
Python 数据探索
D.plot(logx = True) / D.plot(logy =True) 对x轴(y轴)使用对数刻度(以10为底),y轴(x轴)使用线性刻度,进行plot函数绘图,D为Pandas的DataFrame或者Series。有两种比较简单的方式绘 制D的箱型图,其中一种是直接调用DataFrame的boxplot()方法,另外一种是调用 Series 或 者DataFrame的 plot() 方 法, 并 用kind参数指定箱型(box)。如果在须外没有数据,则在须的底部有一点,点的颜色与须的颜色相同。原创 2022-09-30 17:36:36 · 473 阅读 · 0 评论 -
数据及预处理
一些数据挖掘算法,特别是某些分类算法,要求数据是分类属性形式,如ID3算法等。通过移动属性值的小数位数,将属性值映射到[-1,1]之间,移动的小数位数取决于属性值绝对值的最大值。主要是对数据进行规范化的操作,将数据转换成“适当的” 格式,以适用于挖掘任务及算法的需要。数据规约是将海量数据进行规约,规约之后的数据仍接近于保持原数据的完整性,但数据量小得多。• 同名异义:数据源A中的属性ID和数据源B中的属性ID分别描述的是菜。数据预处理的主要任务包括数据清洗,数据集成,数据变换和数据规约。原创 2022-09-22 22:39:07 · 412 阅读 · 0 评论