![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据处理
文章平均质量分 58
「已注销」
这个作者很懒,什么都没留下…
展开
-
python实现核函数
pdist,用于计算样本对之间的欧式距离;squareform将样本间距离(pdist函数得到的结果)用方阵表示出来。如果输入特征是一维标量,该函数的形状为钟形曲线,参数\sigma控制曲线的宽度(胖瘦)。二:sigmoid核函数。原创 2023-04-16 19:21:31 · 1114 阅读 · 0 评论 -
numpy计算常见的距离
既然欧几里得距离无法忽略指标度量的差异,所以在使用欧氏距离之前需要对底层指标进行数据的标准化,而基于各指标维度进行标准化后再使用欧氏距离就衍生出来另外一个距离度量——马哈拉诺比斯距离(Mahalanobis Distance),简称马氏距离。显然, A离左边的更近, A属于左边总体的概率更大, 尽管A与a的欧式距离远一些。欧氏距离是基于各维度特征的绝对数值,需要保证各维度指标在相同的刻度级别,比如对身高(cm)和体重(kg)两个单位不同的指标使用欧式距离可能使结果失效。马氏距离是基于样本分布的一种距离。原创 2023-04-16 15:22:59 · 1118 阅读 · 0 评论 -
matplotlab数据可视化
bar的参数width获取了多个参数值,把前面的’g’也当成参数了。介绍金融数据里一些常见的2D、3D图形,使用matplotlib。如上图,因为刻度的原因,看不出绿色线的波动情况。原创 2023-04-14 21:08:00 · 211 阅读 · 0 评论 -
数据归一化与标准化处理python
应用场景:在不涉及距离度量、协方差计算、数据不符合正太分布的时候,可以使用该方法或其他归一化方法(不包括Z-score方法)。应用场景:在分类、聚类算法中,需要使用距离来度量相似性的时候(比如K-means等聚类算法 中),或者使用PCA技术进行降维的时候,Z-score standardization表现更好。(1)归一化:将样本的特征值转换到同一量纲下把数据映射到[0,1]或者[-1, 1]区间内。(1) 线性函数将原始数据线性化的方法转换到[0 1]的范围, 计算结果为归一化后的数据,X为原始数据。原创 2023-04-14 20:48:07 · 1049 阅读 · 0 评论