无监督学习概论

最新推荐文章于 2024-04-06 23:50:23 发布

Jack you123

最新推荐文章于 2024-04-06 23:50:23 发布

阅读量979

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38870388/article/details/109136042

版权

机器学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

无监督学习是从无标注的数据中学习数据的统计规律或者说内在结构的机器学习，主要包括聚类、降维、概率估计。

可以考虑发掘数据的纵向结构，把相似的样本聚到同类，即对数据进行聚类。还可以考虑发掘数据的横向结构，把高维空间的向量转换为低维空间的向量，即对数据进行降维。也可以同时考虑发掘数据的纵向和横向结构，假设数据由含有隐式结构的概率模型生成得到，从数据中学习该概率模型。

层次聚类法、k均值聚类是硬聚类方法。

高斯混合模型EM算法是软聚类方法。

主成分分析、潜在语义分析是降维方法。

概率潜在语义分析、潜在狄利克雷分配是概率模型估计方法。

无监督学习方法

1、聚类

a、硬聚类。一个样本只能属于一个类。模型是函数 $z = g_{\theta}(x)$

b、软聚类。一个样本可以属于多个类。模型是条件概率分布 $P_{\theta }(z|x)$

(发掘数据的纵向结构，把相似的样本聚到同类)

2、降维

降维是将训练数据中的样本（实例）从高维空间转换到低维空间。降维的模型是函数 $z =g _{\theta }(x)$ ，其中 $x \in X$ 是样本的高维度向量， $z \in Z$ 是样本的低维向量， $\theta$ 是参数。函数可以是线性的函数也可以是非线性的函数。

3、概率模型估计

概率模型包括混合模型、概率图模型等。

概率模型表示为条件概率分布 $P_{\theta }(x|z)$ ，其中随机变量x表示观察数据，可以是连续变量也可以是离散变量；随机变量z表示隐式结构，是离散变量；随机变量 $\theta$ 表示参数。模型是混合模型时，z表示成分的个数；模型是概率模型时，z表示图的结构。

根据贝叶斯公式：

$P(z|x) = P(z)P(x|z)/P(x) \propto P(z)P(x|z)$

假设先验概率服从均匀分布，只需要估计条件概率分布 $P_{\theta }(x|z)$

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
无监督学习概论

无监督学习是从无标注的数据中学习数据的统计规律或者说内在结构的机器学习，主要包括聚类、降维、概率估计。可以考虑发掘数据的纵向结构，把相似的样本聚到同类，即对数据进行聚类。还可以考虑发掘数据的横向结构，把高维空间的向量转换为低维空间的向量，即对数据进行降维。也可以同时考虑发掘数据的纵向和横向结构，假设数据由含有...
复制链接

扫一扫

专栏目录

博客等级

码龄7年

98
原创

77
点赞

516
收藏

112
粉丝

关注

私信

热门文章

分类专栏

最新评论

华泰单因子之动量类因子
小乔宝宝: UU请问下有吗
快照数据分析
weixin_44311724: 您好，请问您复现出了《海通证券-选股因子系列研究（四十七）：捕捉投资者的交易意愿》这篇研报吗，我最近在复现这篇研报，使用的是2019年之后的数据，但是结果与研报的结果相反，不知道哪里出了问题，能否和您交流一下相关内容。
利用Tushare将股票数据写入MySql数据库
eykisu2021: if self.end_dt ==end_dt:, 请教下，这个怎么理解
多因子系列研报对比
m0_64970164: 可以求分享下研报嘛
华泰单因子之动量类因子
Batling�: 您好，请问求一份动量因子复现代码吗？我是学生做学习用，文章看的很明白，但coding能力不太好复现不了全文，如果可以的话感激不尽🙇‍♀️。邮箱1455955616@qq.com。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。