非监督学习简介

最新推荐文章于 2023-12-20 15:39:36 发布

morning's light

最新推荐文章于 2023-12-20 15:39:36 发布

阅读量801

点赞数

分类专栏：机器学习文章标签：聚类算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62009410/article/details/121718231

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在非监督学习中，训练数据是没有加标签的。
下面是一些最重要的非监督学习算法：

聚类
- 均值
- 层次聚类分析（Hierarchical Cluster Analysis，HCA）
- 期望最大值
可视化和降维
- 主成分分析（Principal Component Analysis，PCA）
- 核主成分分析
- 局部线性嵌入（Locally-Linear Embedding，LLE）
- t-分布邻域嵌入算法（t-distributed Stochastic Neighbor Embedding，t-SNE）
关联性规则学习
- Apriori 算法
- Eclat 算法

例如，假设有一份关于博客访客的大量数据。想运行一个聚类算法，检测相似访客的分组。算法无需知道访客属于哪一类：它会自己找出关系，无需帮助。例如，算法可能注意到 40% 的访客是喜欢漫画书的男性，通常是晚上访问，20% 是科幻爱好者，他们是在周末访问等等。如果使用层次聚类分析，它可能还会细分每个分组为更小的组。这可以帮助为每个分组定位博文。
与此有关联的任务是降维，降维的目的是简化数据、但是不能失去大部分信息。做法之一是合并若干相关的特征。例如，汽车的里程数与车龄高度相关，降维算法就会将它们合并成一个，表示汽车的磨损。这叫做特征提取。
另一个重要的非监督任务是异常检测（anomaly detection） —— 例如，检测异常的信用卡转账以防欺诈，检测制造缺陷，或者在训练之前自动从训练数据集去除异常值。异常检测的系统使用正常值训练的，当它碰到一个新实例，它可以判断这个新实例是像正常值还是异常值。

morning's light

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
非监督学习简介

非监督学习简介
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。