机器学习的本质

一般而言,机器学习方法包含以下几个组件:


假设集H :所有预测用的函数h的集合,根据其输出值,可以将问题分为回归和分类
数据D:已知的数据集合,通常包含训练数据和测试数据
算法A:在H中选取一个在D上表现最好的假设,在实际中,就是通过最优化理论来选择模型参数。

VC bound :在训练数据和测试数据从同一个概率分布抽取,且数据量够大时时,对于常见的 error measure(0/1 error, square error 等),h在训练数据上的表现与在测试数据上的表现接近,于是我们可以通过最小化训练数据上 error 来最小化在整个数据分布上的 error。


不管机器学习算法怎么变,这些组件都差不多,我认为它们就是机器学习的本质。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值