【吃瓜之旅】第一二章吃瓜学习

本文链接：https://blog.csdn.net/QAQterrible/article/details/126376662

【吃瓜之旅】本系列是针对datawhale《吃瓜教程-西瓜书和南瓜书》的学习笔记。本次是对西瓜书第一二章的个人学习总结。第一章对机器学习做整体介绍，第二章介绍如何评价机器学习算法。整体来说这两章会融会贯通到整本书，而且难度也不小。确实如文睿大佬所说需要学完后回头再认真看看。目前已经看完了，就在这简单做做总结方便回顾复习。

第一章：绪论

1.1引言

引言通过人类经验对事情预判引入，点明机器学习的目的：利用计算机通过对数据总结“模型”，应用“模型”做判断。

1.2基本术语

这个略，看到后面就明白了。

1.3假设空间

是对一个问题做了全集讨论，比如挑西瓜，有“色泽”、“根蒂”、“巧声”三个指标，每个指标有三个值。然后假设空间为4*4*4+1。每个3+1。多的这个一代表任意都可以，最后加的1代表空集。感叹考虑的真全面。接下来可能有些假设空间冲突，引入版本空间问题。带入到归纳偏好问题中。

1.4归纳偏好

个人理解就是，两个那都觉得挺好的瓜，教你怎么挑。（挑完发现自己白努力了）。治好了我的选择困难。

主要有归纳偏好的原则：“奥卡姆剃刀”，以简单为准。

然后又提出“如何定义简单”这个问题。

接着书里面的骚操作就来了，选了二分类问题证明其实怎么努力其实都可能差不多（数学期望相等）。即“没有免费的午餐”NFL。最后还是到选瓜中，有些瓜看起来一样好，但是其中一个可能并不常见。应该把做归纳偏好的中心放在研究的问题本身上，而不是想怎么挑方法的问题。昨天就和女朋友讲其实有很多很好的女生，但是和她在一起就很放松，很合适自己。

1.5发展历程

历史课。将一些机器学的发展融到一起，像七龙珠，这节是合在一起。后面每一颗都散在各个章节。首先介绍机器学习各个时期的情况。然后介绍代表性工作，学术组织。然后总写机器学习的各种划分。接着对每一种介绍：“从样例中学习”——决策树、“连接主义学习”——BP算法、“统计学习”——SVM、“深度学习”。

1.6应用现状

分支学科应用、交叉学科应用，通过重要组织介绍机器学习的重要性，阐述了数据挖掘中机器学习、数据库是左膀右臂，统计学为数据挖掘提供思想。介绍经典应用：互联网搜索、自动驾驶、竞选核武器、深入理解“人类如何学习”的问题。

1.7阅读材料

介绍了很多机器学习的相关知识。包括入门材料、本书的参考文献、启蒙思想概念学习、学科原则、相关优质会议及刊物。