吴恩达老师的课程已经看完了,但是由于只是通过快速观看课程,以了解一个大概,所以没有做练习,现在准备继续看周志华老师的机器学习书籍,争取边看边做笔记,再把课后习题完成。
归纳:从特殊到一般的泛化过程。
演绎:从一般到特殊的特化过程。
假设空间与版本空间的概念:搬来两位位博主的博客
https://blog.csdn.net/qq_20936739/article/details/77982056
https://blog.csdn.net/william_munch/article/details/87172257
我理解的话,假设空间就是根据样本的特征属性列出所有可能的情况,以及一种像书中说的极端情况,可能“好瓜”根本不存在,我觉得这个“好瓜”的说法可能是对应分类问题的正类吧。
版本空间就是根据训练集的结果将假设空间中与正类不一致,与负类一致的结果剔除,剩下的就是版本空间。所以是不是可以说版本空间可以泛华测试集的所有正类呢?我想应该是的吧。
习题1.1
色泽有“青绿”“乌黑”两种,根蒂有“蜷缩””稍蜷“两种,敲声有”浊响“”沉闷“两种,那么每个特征都还有一个什么值都合适,用通配符“*”,再加上∅这种 表示不存在好瓜的情况,所以总的假设空间有3*3*3+1=28种
编号 | 色泽 | 根蒂 | 敲声 |
1 | * | * | * |
2 | 青绿 | * | * |
3 | 青绿 | 蜷缩 | * |
4 | 青绿 | 蜷缩 | 浊响 |
5 | 青绿 | 蜷缩 | 沉闷 |
6 | 青绿 | 稍蜷 | * |
7 | 青绿 | 稍蜷 | 浊响 |
8 | 青绿 | 稍蜷 | 沉闷 |
9 | 乌黑 | * | * |
10 | 乌黑 | 蜷缩 | * |
11 | 乌黑 | 蜷缩 | 浊响 |
12 | 乌黑 | 蜷缩 | 沉闷 |
13 | 乌黑 | 稍蜷 | * |
14 | 乌黑 | 稍蜷 | 浊响 |
15 | 乌黑 | 稍蜷 | 沉闷 |
16 | * | 蜷缩 | * |
17 | * | 蜷缩 | 浊响 |
18 | * | 蜷缩 | 沉闷 |
19 | * | 稍蜷 | * |
20 | * | 稍蜷 | 浊响 |
21 | * | 稍蜷 | 沉闷 |
22 | * | * | 浊响 |
23 | * | * | 沉闷 |
24 | 青绿 | * | 浊响 |
25 | 青绿 | * | 沉闷 |
26 | 乌黑 | * | 浊响 |
27 | 乌黑 | * | 沉闷 |
28 | ∅ |
1、首先剔除与好瓜不一致,样本一的好瓜为青绿,蜷缩,浊响,所以可以剔除5,6,7,8,9,10,11,12,13,14,15,18,19,20,21,23,25,26,27,28
2、再剔除与样本一本身一致的,所以剔除4
3、再剔除与坏瓜一致的,坏瓜样本四为乌黑、稍蜷、沉闷,所以剔除1,15,19,21,23,27
最后剩下2,3,16,17,22,24。
所以版本空间为
色泽=青绿,根蒂=*,敲声=*
色泽=青绿,根蒂=蜷缩,敲声=*
色泽=*,根蒂=蜷缩,敲声=*
色泽=*,根蒂=蜷缩,敲声=浊响
色泽=*,根蒂=*,敲声=浊响
色泽=青绿,根蒂=*,敲声=浊响
以上是按照剔除与正例不一致,与反例一致的版本空间步骤,
如果是直接根据正例画出版本空间,则如下:
我个人理解为,从下至上,首先根据正例推出,从特征只有一个通配符,到两个。直至n-1个通配符(n为特征数)
习题1.2
看不懂,过。
第一章习题除了第一题,竟然全都看不懂,好吧,过。