简述
西瓜书的鼎鼎大名早有耳闻,于是毫无疑问买来入门。
写此文章的时候刚要做完第二章的练习题。
在看的时候有一些感慨:
- 需要一定的数理基础,尤其是概率论的内容。但是如果没学过也不建议直接去啃概率论,只要把相关的部分看看即可。
- 周老师默认我们能力很强,所以有些地方说得不够详细,仅靠此书无法理解,需要自己另行查阅。
- 有一些疑似谬误的地方,但是我自己能力较差,又苦于没有人佐证,所以并不敢说周老师一定错了。
在看的过程中,记录了一些自己的疑问。有些解决了,有些没解决,也有一些没有记录下来。下面附上记录下来的内容。
说明
因为博主也在学习过程中,所以问题会有更新。方式还没想好,届时再说。
大家有看法欢迎评论,因为一个人看真的很难受……
记录的问题
- P31 绘制P-R曲线的过程,语焉不详,可参考P33 ROC曲线绘制过程,但建议还是上网查。
- P32 F1度量,P和R的究竟在哪一点取值,语焉不详。有博主认为,F1的P和R是实际训练结果的取值;若依此言,F1就不是学习器的性能量度,而是分类器的性能量度;因为显然,在相同的学习器下,不同分类器将得到不同的P和R值。
- P35 公式2.20,从书34页b图看来,AUC的公式不应该写的这么复杂,后来才发现原来这个图并没有正例反例预测值相等的情况。当出现这种情况时,ROC曲线会呈斜线上升,而不是这种只有水平和垂直两种情况。
- P36 式2.24,p的含义 “样例为正例的概率” 语焉不详,公式难懂。参考https://www.zhihu.com/question/63492375/answer/247885093,回答非常详细经典。
- P38 公式2.27,等号右侧的є和є0 好像写反了。