人工智能-聚类算法、误差评估、算法优化、特征降维

海星？海欣！

已于 2023-01-04 14:43:06 修改

阅读量1.4k

点赞数 2

分类专栏：人工智能文章标签：聚类算法人工智能

于 2022-12-31 21:17:21 首次发布

本文链接：https://blog.csdn.net/Sun123234/article/details/128425429

版权

1、聚类算法简介

典型的无监督算法，主要用于将相似的样本自动归到一个类别中。
根据样本之间的相似性，将样本划分到不同的类别中，对于不同的相似度计算方法，会得到不同的聚类结果。常用的相似度计算方法是欧式距离法

聚类算法与分类算法的区别：
聚类算法是无监督的学习算法，而分类算法属于监督学习。

2、聚类算法API

API：sklearn.cluster.KMeans(n_clusters=8)
参数：n_clusters要聚类的中心数，默认值8
调用方法：estimator.fit(x)、estimator.predict(x)、estimator.fit_predect(x)-指先fit再预测

2.1案例

import matplotlib.pyplot as plt
#from sklearn.datasets.samples_generator import make_blobs
from sklearn.cluster import KMeans
#from sklearn.metrics import calinski_harabaz_score

#创建数据
x,y = make_bloks(n_samples=1000,n_features=2,centers=[[-1,-1],,[0,0],[1,1],[2,2]],cluster_std=[0.4,0.2,0.2,0.2],random_state=9)
#生成1000个数，两个特征值，4个中心点，标准差越大越离散，
plt.scatter(x[:,0],x[:,1],marker="o")
plt.show()

在这里插入图片描述

#kmeans训练且可视化
y_pre = KMeans(n_clusters=2,random_stats=9).fit_predict(x)

#可视化展示
plt.scatter(x[:,</

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

海星？海欣！

关注关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

人工智能_机器学习099_PCA数据降维算法_SVD分解矩阵原理002_酉矩阵_共轭矩阵_全矩阵_符号翻转_奇异值分解代码实现---人工智能工作笔记0224

添柴程序猿的专栏

09-24

357

比如np.sign([1,2,-2,-0.5])得到的结果是[1,1,-1,-1]可以看到其实就是拿到的是符号。所以,我们得到的U E VT三个矩阵,其中西格玛 E,这个一维的奇异值,他的值是从大到小排列的。可以看到是一模一样的,也就是pca特征值,特征向量算法,降维,其实就是用的标准差进行。然后再就是可以进行,符号翻转,其实就是拿到U矩阵中的,每个列中值最大的,获取到他的。如果把符号翻转这里去掉,就会导致,值是一样的,但是结果的符号就不一样了对吧.

[Python从零到壹] 十三.机器学习之聚类算法四万字总结全网首发（K-Means、BIRCH、树状聚类、MeanShift）

杨秀璋的专栏

07-06

1万+

欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解，真心想把自己近十年的编程经验分享给大家，希望对您有所帮助，文章中不足之处也请海涵。Python系列整体框架包括基础语法10篇、网络爬虫30篇、可视化分析10篇、机器学习20篇、大数据分析20篇、图像识别30篇、人工智能40篇、Python安全20篇、其他技巧10篇。您的关注、点赞和转发就是对秀璋最大的支持，知识无价人有情，希望

参与评论您还未登录，请先登录后发表或查看评论

人工智能1—K-means聚类算法

wwy的博客

09-08

3050

K-means聚类算法目录 K-means聚类算法 1.聚类算法 2.分析 2.1、原理 2.2、算法步骤 3、优点 4、缺点 5、解决 1.聚类算法聚类分析又称群分析，它是研究（样品或指标）分类问题的一种统计分析方法，同时也是数据挖掘的一个重要算法。聚类分析以相似性为基础，它是将抽象的集合划分出成为类似对象组成的的对象类（即簇）的一个过程，在一个聚类中...

人工智能——聚类算法

weixin_46039719的博客

02-02

955

1 机器学习

Python人工智能经典算法之聚类算法

不一样的花朵的博客

08-29

398

5.3 Boosting【**】 1.boosting集成原理随着学习的积累从弱到强 2.实现过程 1.初始化训练数据权重，初始权重是相等的 2.通过这个学习器，计算错误率 3.计算这个学习期的投票权重 4.对每个样本进行重新赋权 5.重复前面1-4 6.对构建后的最后的学习器进加权投票 3.bagging集成与boosting集成的区别：数据方面：

人工智能/机器学习基础知识——聚类（原型聚类、密度聚类、层次聚类）

WindGrin_的博客

04-13

1089

人工智能/机器学习基础知识——聚类（原型聚类、密度聚类、层次聚类）

人工智能-聚类算法（分级聚类）

weixin_53284122的博客

04-09

2229

题目描述：在二维平面根据一定特点产生一些点，然后给定标签，之后生成txt文档数据。生成数据代码： import random import numpy as np import matplotlib.pyplot as plt import numpy as np import matplotlib.pyplot as plt def genConCircle(filePath, r1, r2, eps): """ :param filePath: :pa

AI 人工智能学习之聚类分析及算法(2)

无为的专栏

10-30

1553

聚类，k-means 算法，DBSCAN聚类算法，聚类评估，轮廓系数

原创 | 一文读懂K均值（K-Means）聚类算法

数据派THU

10-17

5253

作者：王佳鑫审校：陈之炎本文约5800字，建议阅读10+分钟本文为你介绍经典的K-Means聚类算法。概述众所周知，机器学习算法可分为监督学习(Supervised learning)和无监督学习(Unsupervised learning)。监督学习常用于分类和预测。是让计算机去学习已经创建好的分类模型，使分类（预测）结果更好的接近所给目标值，从而对未来数据进行更好的分类和预测。因此，数据...

聚类算法总结

最新发布

2401_84689394的博客

05-02

985

现有1999年全国31个省份城镇居民家庭平均每人全年消费性支出的八个主要变量数据，这八个变量分别是：食品、衣着、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化服务、居住以及杂项商品和服务。利用已有数据，对31个省份进行聚类。

【机器学习】聚类算法详细介绍（理论+图解）

CSDN 精品推荐

07-16

5097

简介：下面是我在学习时候的记录并加上自己的理解。本文意在记录自己近期学习过程中的所学所得，如有错误，欢迎大家指正。关键词：Python、机器学习一、聚类算法的定义像一些经典的算法比如随机森林、支持向量机这些算法我们都知道，他们都是基于对数据标签进行学习，但是往往有的时候我们获得的数据是没有标签的，只有特征列数据等，这个时候我们就不能够使用之前的算法进行建模，我们需要采用一种新的方式进行区分样本。在生活中，可以采用人工的方式进行将数据分类，利用人的经验分析数据的结构..

人工智能-机器学习-KMeans聚类

纯洁的小魔鬼

10-15

3314

一.概述 k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法，属于无监督学习的一种，其步骤是，预先将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以分为3中: 1. 没有（或最小数目）对象被重新分配给不同的聚类 2

【机器学习-聚类算法】层次聚类

梦想道路上的萌新

12-14

1352

层次聚类层次聚类(Hierarchical Clustering)是聚类算法的一种，通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中，不同类别的原始数据点是树的最低层，树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法。作为一家公司的人力资源部经理，你可以把所有的雇员组织成较大的簇，如主管、经理和职员；然后你可以进一步划分为较小的簇，例如，职员簇...

PO-BP优化算法提升BP神经网络在Matlab中的分类预测

7. 机器学习和深度学习：机器学习是人工智能的一个分支，它使计算机系统能够通过经验自我改进。深度学习是机器学习的一种方法，通过构建深层的神经网络来模拟人脑处理数据和学习的方式。该资源作者作为机器学习领域...