《机器学习那些事》读书笔记

1、模型的三要素:

a) 表示(假设空间):目前很多书籍对模型的分类都是基于假设空间的

b) 评价(损失函数):是一个评价标准

c) 优化(优化算法):一个搜索算法,能够在假设空间中找到评价函数得分最高的假设

2、泛化:

训练集要和测试集分开

3、模型选择:

根据数据之间的关系和模型的表示(这里指的是假设)来选择模型;实际在进行模型选择的时候都是通过评测来实现的。

4、过拟合:

a) 表现:训练误差很小,测试误差很大

b) 解决的方案:对评测函数增加一个正则项;交叉验证选择模型参数

c) 过拟合,方差(variance);欠拟合,偏执(bias)。过拟合的表现是高方差,欠拟合的表现就是高偏执

5、高维空间

a) 维度越高越难泛化,因为维度越高(特征多)输入空间越大

b) 可以通过降维来提高效果

6、特征工程

a) 自动化的特征选择:选收集全量的特征,然后计算每个特征与分类的信息增益来选择特征

b) 特征工程是和领域相关的,也是最花时间的部分

7、更多的数据胜过更聪明的算法

a) 包括更多的样例和更多的特征

b) 非常不同的算法会产生类似的边界

8、模型集成:

a) 通过重采样随机生成若干个不同的训练集,在每个集合上生成一个分类器,然后用投票的方式讲结果合并。此方法比较有效,原因是在轻度增加偏置的同时极大的降低了方差(类似于 boosting 的思想)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值