![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 76
Lucky &powerful
我希望是最优秀的
展开
-
数据挖掘——数据规范化的两种方法的比较
使用 Min-Max 规范化时,数据将被映射到一个固定的范围内,通常是[0, 1],适用于数据范围已知且没有异常值的情况。使用 Z-score 规范化时,数据将转换为均值为0,标准差为1的标准正态分布,适用于数据存在异常值或需要转换为标准正态分布的情况。原创 2024-04-02 17:34:10 · 419 阅读 · 1 评论 -
SCAU数据挖掘与数据分析——各种数据类型的邻近性度量
首先先打出来数据表然后观察数据,一般要实现二值化或是独热编码处理(将文本数据啥的转化为01 )然后使用方法计算距离(有各种计算距离(也就是差距,邻近性度量)的方法 )最后为了好看,用数据表在封装起来展示(有对象名)另一方面,本章学习了两个对象之间的邻近性度量,每个对象都有特殊的数据类型,他们具体的数据是有(标称、二值、序列 、数值、混合等数据类型)原创 2024-03-23 19:54:51 · 1634 阅读 · 0 评论 -
长格式和宽格式的用法
长格式和宽格式是数据组织的两种不同方式,它们在处理和分析数据时各有优缺点。原创 2024-03-16 20:11:51 · 521 阅读 · 1 评论 -
SCAU数据挖掘与数据分析——熟悉matplotlib 和pandas包——画花相关数据的直方图,散点图,箱线图
在python中使用matplotlib等包,结合iris Excel表,实现直方图,散点图与箱线图。5) 给图片添加一些标签,说明图片某个对象,例如,直方图上直方柱上添加数字(选做)。3) 设计并调整图的标题:大小为20(可任意调整),加粗。6) 以上代码需要给出python代码,和运行后的结果图。1) 调整散点图坐标刻度,相邻刻度相差2。4) 给出legend。原创 2024-03-16 19:46:00 · 328 阅读 · 1 评论