《机器学习那些事》读书笔记

最新推荐文章于 2024-04-28 16:39:42 发布

bokecai

最新推荐文章于 2024-04-28 16:39:42 发布

阅读量418

点赞数

分类专栏：机器学习文章标签：机器学习读书笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bokecai/article/details/44981907

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1、模型的三要素：

a) 表示(假设空间)：目前很多书籍对模型的分类都是基于假设空间的

b) 评价(损失函数)：是一个评价标准

c) 优化(优化算法)：一个搜索算法，能够在假设空间中找到评价函数得分最高的假设

2、泛化：

训练集要和测试集分开

3、模型选择：

根据数据之间的关系和模型的表示(这里指的是假设)来选择模型；实际在进行模型选择的时候都是通过评测来实现的。

4、过拟合：

a) 表现：训练误差很小，测试误差很大

b) 解决的方案：对评测函数增加一个正则项；交叉验证选择模型参数

c) 过拟合，方差(variance)；欠拟合，偏执(bias)。过拟合的表现是高方差，欠拟合的表现就是高偏执

5、高维空间

a) 维度越高越难泛化，因为维度越高(特征多)输入空间越大

b) 可以通过降维来提高效果

6、特征工程

a) 自动化的特征选择：选收集全量的特征，然后计算每个特征与分类的信息增益来选择特征

b) 特征工程是和领域相关的，也是最花时间的部分

7、更多的数据胜过更聪明的算法

a) 包括更多的样例和更多的特征

b) 非常不同的算法会产生类似的边界

8、模型集成：

a) 通过重采样随机生成若干个不同的训练集，在每个集合上生成一个分类器，然后用投票的方式讲结果合并。此方法比较有效，原因是在轻度增加偏置的同时极大的降低了方差(类似于 boosting 的思想)。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
《机器学习那些事》读书笔记

1、模型的三要素：a) 表示(假设空间)：目前很多书籍对模型的分类都是基于假设空间的b) 评价(损失函数)：是一个评价标准c) 优化(优化算法)：一个搜索算法，能够在假设空间中找到评价函数得分最高的假设2、泛化：训练集要和测试集分开3、模型选择：根据数据之间的关系和模型的表示(这里指的是假设)来选择模型；实际在进行模型选择的时候都是通过评测来实现的。4、过拟合：
复制链接

扫一扫

专栏目录

bokecai CSDN认证博客专家 CSDN认证企业博客

码龄13年

2: 原创

167万+: 周排名

190万+: 总排名

1728: 访问

: 等级

42: 积分

1: 粉丝

1: 获赞

3: 评论

0: 收藏

私信

关注

热门文章

分类专栏

机器学习 1篇
搜索引擎 1篇

最新评论

统计语言模型学习笔记
数据人生: 作者你好，有个问题想问你一下，文中提到，这样出现 r 次的词的频率估计为 dr / N。请问你是怎么推导的呢？
《机器学习那些事》读书笔记
bokecai: 第一天开博，谢谢支持
《机器学习那些事》读书笔记
starays: 顶！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

统计语言模型学习笔记

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。