- 博客(3)
- 收藏
- 关注
原创 python3用matplotlib绘图出现中文乱码的问题
python中的matplotlib仅支持Unicode编码,默认是不显示中文的,如果让其默认显示中文,方法如下:from pandas import Series,DataFrameimport matplotlib.pyplot as pltfrom pylab import mplmpl.rcParams['font.sans-serif'] = ['SimHei'] 字体的...
2018-09-12 21:15:24 3012
原创 K-means聚类算法
k-means算法是一种基于划分的聚类算法,以距离作为数据对象间相似性度量的标准,即数据对象间的距离越小,则它们的相似性越高,则它们越有可能在同一个类簇。数据对象间距离的计算有很多种,k-means算法通常采用欧氏距离来计算数据对象间的距离。(1)计算数据对象的距离 k-means通常采用欧氏距离来计算数据对象间的距离。下面给出欧式距离的计算公式: (2)聚类过...
2018-09-04 16:25:05 1467
原创 算法:PCA的理解
PCA算法步骤总结:设有m条n维数据,这里比较糊涂就是按行组织样本还是按列组织样本,下面是按行组织样本:1)将原始数据按行组成n行m列矩阵X,代表有n个数据,每个数据m个特征2)将X的每一列(代表一个属性字段)进行零均值化,即减去这一列的均值3)求出协方差矩阵C=1/n* XXT(不同维度之间的协方差,而不是不同样本之间)4)求出协方差矩阵的特征值及对应的特征向量5)将特征向量按对应...
2018-09-04 15:54:58 378
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人