python 降维聚类_机器学习-数据预处理、降维、特征提取及聚类

最新推荐文章于 2024-01-11 22:08:31 发布

weixin_39721009

最新推荐文章于 2024-01-11 22:08:31 发布

阅读量290

点赞数

文章标签： python 降维聚类

一、K均值聚类算法

import numpy as np

import matplotlib.pyplot as plt

from sklearn.datasets import make_blobs

from sklearn.cluster import KMeans

from sklearn.preprocessing import StandardScaler

X_1 = StandardScaler().fit_transform(X)

X, y = make_blobs(n_samples=40, centers=3, random_state=50, cluster_std=2)

blobs = make_blobs(random_state=1,centers=1)

X_blobs = blobs[0]

kmeans = KMeans(n_clusters=3)

kmeans.fit(X_blobs)

x_min, x_max = X_blobs[:, 0].min()-0.5 , X_blobs[:, 0].max()+0.5

y_min, y_max = X_blobs[:, 0].min()-0.5 , X_blobs[:, 1].max()+0.5

xx, yy = np.meshgrid(np.arange(x_min, x_max, .02),

np.arange(y_min, y_max, .02))

Z = kmeans.predict(np.c_[xx.ravel(), yy.ravel()])

Z = Z.reshape(xx.shape)

plt.figure(1)

plt.clf()

plt.imshow(Z, interpolation='nearest',

extent=(xx.min(), xx.max(), yy.min(), yy.max()),

cmap=plt.cm.summer,

aspect='auto', origin='lower')

plt.plot(X_blobs[:, 0], X_blobs[:, 1], 'r.', markersize=5)

centroids = kmeans.cluster_centers_

plt.scatter(centroids[:, 0], centroids[:, 1],

marker='x', s=150, linewidths=3,

color='b', zorder=10)

plt.xlim(x_min, x_max)

plt.ylim(y_min, y_max)

plt.xticks(())

plt.yticks(())

plt.show()

二、凝聚聚类算法工作原理展示

from scipy.cluster.hierarchy import dendrogram, ward

linkage = ward(X_blobs)

dendrogram(linkage)

ax = plt.gca()

plt.show()

三、DBSCAN算法对make_blobs数据集的聚类结果

from sklearn.cluster import DBSCAN

db = DBSCAN(min_samples = 20)

clusters = db.fit_predict(X_blobs)

plt.scatter(X_blobs[:, 0], X_blobs[:, 1], c=clusters, cmap=plt.cm.cool,

s=60,edgecolor='k')

plt.xlabel("Feature 0")

plt.ylabel("Feature 1")

plt.show()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39721009

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python 高维数据降维聚类显示

赫凯的博客

10-12

1510

先用 t-SNE 将数据进行降维，然后再依据聚类，做完聚类的结果在降维数据展示就可以了。就觉在这个图还蛮好看的。

深入浅出Python机器学习9——数据预处理、降维、特征提取及聚类

繁华落尽心殇

09-16

3333

通过数据预处理（Data preptocessing）可以有助于提高模型的准确率，这也就是我们为什么要研究它的原因。

参与评论您还未登录，请先登录后发表或查看评论

#第28篇分享：数据聚类及降维（python语言：sklearn 聚类算法KMeans）（4）

weixin_46008828的博客

03-07

886

c.聚类算法（无监督学习：）： ①.K-means（k-means clustering algorithm）： ①算法概念 k均值聚类算法是一种迭代求解的聚类分析算法：其步骤是，预将数据分为K组，则随机选取K个对象作为初始的聚类中心（质心），然后计算每个对象与各个种子质心之间的距离，把每个对象分配给距离它最近的质心；接着根据距离的均值更换质心，直到质心不变或者变化较小后，聚合结束。从上面可以看出，质心的选择及K的选择会影响最终的聚类效果。 ②.算法思路：添加链接描述 ③优缺点：优点：算法容易理解，聚

【机器学习】聚类算法（三）

cxyhjl的博客

01-11

1079

六、基于图的算法6.1 谱聚类6.2 算法原理RatioCut算法NCut算法6.3 如何选择合适的K值6.4 谱聚类的应用场景示例代码1：对鸢尾花数据集进行聚类，并绘制结果# 导入所需的库 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import load_iris from sklearn.c...

机器学习 sklearn 无监督学习聚类算法 DBSCAN

404detective的博客

08-17

1371

import numpy as np import matplotlib.pyplot as plt from sklearn.cluster import DBSCAN from sklearn.cluster import KMeans from sklearn import datasets # 生成数据 x1, y1 = datasets.make_circles(n_samples=2000, factor=0.5, noise=0.05) x2, y2 = datasets.make_...

kNN.rar_knn_knn聚类_python 聚类_机器学习项目

09-24

1. 数据预处理：在进行kNN聚类之前，我们需要对数据进行预处理，包括数据清洗、缺失值处理、异常值检测以及特征缩放等步骤。这一步确保了数据的质量和算法的稳定性。 2. 特征选择：选择对聚类有影响的关键特征，这...

人工智能-项目实践-机器学习-基于预处理的小麦品种的分类和聚类

03-02

本项目基于python实现了seeds数据集的预处理与分类、聚类任务，使用了PCA、KPCA、LDA、KLDA四种算法进行数据预处理，使用SVM、逻辑回归、ANN三种方法对预处理与未预处理的数据进行了分类与评估，使用FCM方法对预处理...

python中使用k-means聚类.zip_k-means聚类算法_python_python 用kmeans_聚类_聚类 P

07-15

在Python编程环境中，K-Means聚类是一种广泛使用的无监督机器学习算法，用于将数据集划分成不同的簇。这个算法基于一个简单的概念：通过迭代调整数据点的分类，使得同一簇内的数据点尽可能接近，而不同簇之间的数据...

聚类_iris_python_聚类_

10-02

这个数据集是机器学习领域经典的多类分类问题，通常用于演示和测试各种算法，包括聚类算法。描述提到的“Three classifications of iris data based on Anaconda clustering method”，意味着我们将使用Anaconda...

机器学习算法与应用大作业-基于预处理的小麦品种的分类和聚类源码+数据+使用说明.zip

最新发布

05-08

环境配置 - 项目环境基于python3.6构建，为确保不报错，请使用python>=3.6的版本 ...- `1_1_pca_analysis.py` 自己实现的PCA预处理与sklearn实现的PCA预处理效果对比 - `1_2_kpca_analysis.py` 自己实现的KP

Python——K-means聚类分析及其结果可视化

12-21

0 前言 K-Means是聚类算法的一种，通过距离来判断数据点间的相似度并据此对数据进行聚类。 1 聚类算法科学计算中的聚类方法方法名称参数可伸缩性用例几何形状（使用的指标） K-Means number of clusters Very large , medium with MiniBatch coden_samplesn_clusters General-purpose, even cluster size, flat geometry, not too many clusters Distances between poi

聚类算法的python

weixin_56636204的博客

12-01

1298

本程序由本作者方便自我记忆 import numpy as np import matplotlib.pyplot as plt from sklearn import datasets iris = datasets.load_iris() from sklearn.model_selection import train_test_split x_train, x_test,y_train,y_test= train_test_split(iris.data, iris.target) ..

python多项式拟合结合lasso回归_解析python实现Lasso回归

weixin_39926193的博客

12-08

697

Lasso原理Lasso与弹性拟合比较python实现import numpy as npimport matplotlib.pyplot as pltfrom sklearn.metrics import r2_score#def main():# 产生一些稀疏数据np.random.seed(42)n_samples, n_features = 50, 200X = np.random.ran...

非线性回归-----sklearn实现多项式回归

qq_41977984的博客

09-26

798

多项式回归用sklearn实现多项式回归：数据： import numpy as np import matplotlib.pyplot as plt from sklearn.preprocessing import PolynomialFeatures from sklearn.linear_model import LinearRegression # 载入数据 data = np.genfromtxt("job.csv", delimiter=",") x_data = data[1:

python 将图片转换成像素画_python – 大matplotlib像素图最好的方法

weixin_39531761的博客

11-30

1277

如果您正在处理常规网格,请将其视为图像：import numpy as npimport matplotlib.pyplot as pltnrows, ncols = 1000, 1000z = 500 * np.random.random(nrows * ncols).reshape((nrows, ncols))plt.imshow(z, interpolation='nearest')plt...

python使用 matplotlib 画聚类效果图，使用legend标注类簇

beingstrong的博客

07-30

8160

一般聚完类之后，如果直接使用如下代码来作图，也可以按照默认的颜色定义来区分类簇，但是当类簇个数比较多的时候，颜色会有重复，无法从视觉上较好的区分。 import numpy as np import matplotlib.pyplot as plt from matplotlib.colors import rgb2hex from sklearn.cluster import KM...

机器学习算法 08 聚类探索（04 K-means聚类算法的探索，层次聚类概念，密度聚类-DBSCAN探索）

weixin_41672684的博客

01-08

445

K-means聚类算法的探索 import numpy as np import matplotlib.pyplot as plt import sklearn.datasets as ds import matplotlib.colors from sklearn.cluster import KMeans,MiniBatchKMeans def expand(a,b): d=(b-a)*0.1 return a-d,b+d if __name__ == '__main__':.

scatter和make_blobs方法的学习

bug_12的博客

06-27

787

Scatter方法 scatter(x,y,s=None,c=None,marker=None,cmap=None,edgecolors=None,.....) x,y:形如shape(n,)，输入数据 s:size，标量或形如shape(n,)，可选，默认:20 c:color，色彩或颜色序列，参数：b=blue，y=yellow，g=green，k=black... marker:Marker...

Scikit-learn机器学习实战之Kmeans

python 降维 聚类_机器学习-数据预处理、降维、特征提取及聚类

python 降维聚类_机器学习-数据预处理、降维、特征提取及聚类