机器学习里面的聚类、分类算法（未写完）

最新推荐文章于 2024-04-17 07:00:00 发布

qxq_sunshine

最新推荐文章于 2024-04-17 07:00:00 发布

阅读量287

点赞数

分类专栏：工作面试

工作面试专栏收录该内容

10 篇文章 1 订阅

订阅专栏

1、分类算法：：LR（logist Regression）、SVM、KNN、决策树、RandomForest、GBDT（也不知道是什么）

2、回归算法：non-Linear regression 、 SVM(支持向量回归)、随机森林

3、聚类：k-means、层次聚类（？？不懂）、GMM（高斯混合模型）、谱聚类（？？不懂）

聚类算法唯一用到的信息就是样本与样本之间的相似度；

评判标准：高类类间距离、低类类内距离；高类内相似度，低类间相似度。相似度与距离负相关。

图像之间距离的度量就是对每个像素操作，最后获得距离。其中K-means和GMM需要提前指定类别k

3.1 k-means算法：对于已有的未标记样本，同时给定聚类的个数。目标是把比较接近的样本归为一类、总共得到k个簇群。

k个中心点选取的方法：先随机选取k个样本中心点，然后计算每个样本到k个样本中心点的距离，然后比较待聚类样本到中心点的距离，将待聚类的样本归为距离较近的那一类；最后重新计算聚类中心；重复迭代。

k-means收敛状态：（1）聚类中心不再变化；（2）每个样本到对应聚类的中心距离之和不再有很大变化。

k-means缺点：对初始样本点的选取比较敏感，对异常点的免疫不好（如一个远离大多数点的孤立点）

k-means和k-means++的区别：k-means的初始样本点是随机选取的；k-means++的样本点是选取最远的k个点作为初始的样本点。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。