机器学习(西瓜书)注解:第12章 计算学习理论
本次更新第12章,计算学习理论。针对该章注解有任何问题欢迎在此留言~
相信本章是很多读者望而却步的一章,相信本章是很多以本书为教材的老师在讲课时会直接跳过的一章,相信本章是很多资深机器学习研究者都不予理睬的一章……
但既然已经入了机器学习这个坑,总感觉如果不去了解一点儿有关本章的内容,少点什么似的……
本章前两节介绍概念,12.3节讨论有限假设空间的泛化误差界;但现实学习任务所面临的通常是无限假设空间,因此12.4节基于VC维讨论无限假设空间的泛化误差界;但基于VC维的泛化误差界是分布无关、数据独立的,因此12.5节继续基于Rademacher复杂度讨论泛化误差界;但无论是基于VC维还是Rademacher复杂度的泛化误差界,所得到的结果均与具体学习算法无关,因此12.6节继续基于稳定性(stability)讨论泛化误差界。
本章很多内容参考了[Mohri et al., 2012],可以使用bing或google搜索该书的PDF版;该书2018年已出第2版,官网https://cs.nyu.edu/~mohri/mlbook/即可下载;该书第1版已有中译版,参见[张文生 等译. 机器学习基础. 机械工业出版社,2019.]。
本章不但理论抽象,公式也很多,注解中可能存在很多错误,欢迎留言交流~
(网盘链接:https://pan.baidu.com/s/1QtEiNnk8jMzmbs0KPBN-_w)
第 12 章目录
第 12 章 计算学习理论...................................................................................................................1
12.1 基础知识..........................................................................................................................1
1、式(12.1)的解释...........................................................................................................1
2、式(12.2)的解释...........................................................................................................1
3、式(12.3)的解释...........................................................................................................1
4、 Jensen 不等式的解释 .................................................................................................1
5、 Hoeffding 不等式的解释 ...........................................................................................2
6、 McDiarmid 不等式的解释 .........................................................................................3
12.2 PAC 学习 ..........................................................................................................................3
12.3 有限假设空间..................................................................................................................4
1、式(12.10)的解释 .........................................................................................................4
2、式(12.11)的解释 .........................................................................................................4
3、式(12.12)的推导 .........................................................................................................4
4、式(12.13)的解释 .........................................................................................................5
5、式(12.14)的推导 .........................................................................................................5
6、引理 12.1 的解释........................................................................................................5
7、式(12.18)的推导 .........................................................................................................5
8、定理 12.1 的推导........................................................................................................6
9、定义 12.5 的解释........................................................................................................7
12.4 VC 维 ................................................................................................................................7
1、式(12.21)的解释.........................................................................................................7
2、定理 12.2 的解释........................................................................................................7
3、式(12.23)的解释 .........................................................................................................8
4、引理 12.2 证明的解释................................................................................................8
5、推论 12.2 证明的解释..............................................................................................10
6、定理 12.3 证明的解释..............................................................................................11
7、定理 12.4 证明的解释[?] .........................................................................................11
12.5 Rademacher 复杂度........................................................................................................12
1、式(12.36)的解释.......................................................................................................13
2、式(12.37)的解释.......................................................................................................13
3、式(12.38)的解释.......................................................................................................13
4、式(12.39)的解释.......................................................................................................14
5、定义 12.8 的解释......................................................................................................15
6、定义 12.9 的解释......................................................................................................15
7、定理 12.5 的解释......................................................................................................15
8、定理 12.5 的证明[?] .................................................................................................15
9、定理 12.6 的解释......................................................................................................18
10、定理 12.6 的证明....................................................................................................18
11、定理 12.7 的证明....................................................................................................18
12、式(12.53)的推导 .....................................................................................................20
12.6 稳定性............................................................................................................................20
1、泛化/经验/留一损失的解释.....................................................................................20
2、定义 12.10 的解释....................................................................................................20
3、定理 12.8 的解释......................................................................................................20
4、经验损失最小化.......................................................................................................21
5、定理 12.9 的证明的解释[?] .....................................................................................21
12.7 本章小节........................................................................................................................22