数据生成
qq_27047075
这个作者很懒,什么都没留下…
展开
-
k-means 代码
from sklearn.cluster import KMeanskmeans = KMeans(n_clusters = 3)kmeans.fit(x)y_kmeans = kmeans.predict(x)plt.scatter(x[:,0], x[:,1], c = y_kmeans, cmap='Dark2', s=50, alpha=0.5, marker='x')cen...原创 2020-03-19 14:07:33 · 106 阅读 · 0 评论 -
sklearn 数据预处理
数据可能是高纬度的,资料标准化后会使得每个特征中的数值平均变为0(将每个特征的值都减掉原始资料中该特征的平均),标准差变为1StandardScaler计算训练集的平均值和标准差,以便测试数据及使用相同的变换。 变换后各维特征有0均值,单位方差,也叫z-score规范化(零均值规范化),计算方式是将特征值减去均值,除以标准差。所有数减去其平均值的平方和,所得结果除以该组数...原创 2020-03-19 14:06:26 · 124 阅读 · 0 评论 -
Skclearn 随机生成测试样本——聚类样本
from sklearn.datasets import make_blobsfrom matplotlib import pyplotdata,label = make_blobs(n_samples=1000,n_features=2,centers=5)# 绘制样本显示pyplot.scatter(data[:,0],data[:,1],c=label)pyplot.sho...原创 2020-03-15 14:38:30 · 251 阅读 · 0 评论 -
SKlearn 随机生成测试样本——分类样本
from sklearn.datasets.samples_generator import make_classificationX, y = make_classification(n_samples=200, n_features=4, n_informative=2, n_redundant=2, n_classes=2, n_clusters_per_class=2, sc...原创 2020-03-15 14:35:55 · 838 阅读 · 0 评论