《机器学习》学习笔记_1.机器学习的分类

tinamisu

于 2014-02-20 10:03:28 发布

阅读量922

点赞数

分类专栏：学习笔记机器学习文章标签：学习笔记机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tinamisu/article/details/19541049

版权

这篇学习笔记探讨了机器学习中的分类与回归概念，包括它们的区别与联系。分类通常涉及将数据分配到预定义的类别，而回归处理的是预测连续的数值。此外，还提到了监督学习、半监督学习、无监督学习和增强学习的不同类型。

摘要由CSDN通过智能技术生成

本篇包括：机器学习的分类（分类与回归、监督/半监督/无监督/增强学习、多示例多标签学习、判别式方法和产生式方法）。

1. 分类与回归

以体重为例：

分类classification：输出值为确定的类别标签，可能的标签有{正常、胖、瘦}

回归regression：输出为实数值，如80， 130， 103。

分类和回归其实可以转换，如回归中，把低于90的定义为瘦，高于120的定义为胖，其他为正常，就变成了分类问题。

PS：一般分类都是指二类问题，如果是多类问题，也可以转化为二类，多做几次分类即可。

2. 监督/半监督/无监督/增强学习

针对的是数据集中是否有标签，监督：全部有，无监督：都没有，半监督：只有一些有（而且大部分是少量有）。数学的定义为：

监督学习：

$formdata=D={<x_i,+y_i>}^n_{i=1},+n=|D|,+x_i\in+R^d,+y_i\in+\{+1,+-1\}$

半监督学习：

$formdata=D=X_l\cup+X_u,+X_l=\{<x_i,+y_i>\}^m_{i=1},+X_u=\{<x_i>\}_{i=m+1}^n,+x_i\in+R^d,+y_i\in+\{+1,+-1\},+m<<n-m$

无监督学习：

因为没有标签，所以是聚类问题，把数据集分成几个子集：

$formdata=$D={<x_i>}^n_{i=1},+D=\cup+_{i=1}^K+D_i,+D_i+\cap+D_j+=+\phi$$

常见算法：K-means， SVD， PCA, ICA, GMM, M.S., NMF

3.多示例多标签学习

如一张图片中有多个：蓝天、白云。。。。，要给什么标签？

包中至少有一个标签为正，则包的标签为正，

如果包中没有一个标签为正，则包的标签为负。

4.判别式方法和产生式方法

判别式：直接给分类的结果，有一个明确的分界面，即f: y=f(x)。

产生式：只给出属于某一类的概率，给出的是可能性，即p(y|x)

$formdata=p(y|x)=\frac{p(x,y)}{p(x)}=\frac{p(x|y)\centerdot+p(y)}{p(x)}=\frac{p(x|y)\centerdot+p(y)}{\sum+_y+p(x|y)\centerdot+p(y)}$

产生式可转为判别式：取概率高的类别为最终标签。如班上男女比例是6：1，在不看人的时候猜是男是女，一般就猜是男，因为男生的概率更大。

以下更详细的比较转自：http://blog.163.com/huai_jing@126/blog/static/1718619832011227757554/

判别式模型（discriminative model）

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《机器学习》学习笔记_1.机器学习的分类

本篇包括：机器学习的分类（分类与回归、监督/半监督/无监督/增强学习、多示例多标签学习、判别式方法/产生式方法、统计学习的三要素）。1. 分类与回归以体重为例：分类classification：输出值为确定的类别标签，可能的标签有{正常、胖、瘦}回归regression：输出为实数值，如80， 130， 103。分类和回归其实可以转换，如回归中，把低于90的定义为瘦，高
复制链接

扫一扫

专栏目录

tinamisu CSDN认证博客专家 CSDN认证企业博客

码龄17年

18: 原创

110万+: 周排名

152万+: 总排名

18万+: 访问

: 等级

1190: 积分

19: 粉丝

34: 获赞

7: 评论

142: 收藏

私信

关注

热门文章

分类专栏

最新评论

C++读取txt文本中的矩阵数据
_养乐多_: 引用「double *X, double *Y)」请问这俩参数是什么意思
c++ double类型精确除法运算
小羊coder: 怪不得
C++读取txt文本中的矩阵数据
yeah_hello: 你好, 我有几个问题, 希望能够得到您的解答~ 1. 文件名是fileName吗? 对格式有要求吗? 文件的全名必须是fileName.txt吗? 2. 定义子函数的时候, 非注释的第一行的括号里面有的参数前面会有* (比如*fileName), 请问这个*是什么意思呢? 谢谢您 ;)
C++读取txt文本中的矩阵数据
传说中妖精的尾巴: 请问，如果文件里面每一行的数据是用逗号隔开的怎么办？
C++读取txt文本中的矩阵数据
Santorinisu 回复 Phoebe_Ma: char *fileName=null; fileName="你的数据文件名+后缀（一般为txt）"

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。