【周志华机器学习】 西瓜书吃瓜教程 学习笔记总结Task01

第一章 绪论

1.2 第一章作为引子主要介绍了一些基本术语:

 数据集dataset:记录的集合

 示例instance/样本sample:关于一个事件或对象的描述

 属性attribute/特征feature:反映事件或对象在某方面的表现或性质的事项

 属性值attribute value:属性上的取值

 属性空间attribute space/样本空间sample space/输入空间:属性张成的空间(以属性为坐标轴的多维空间)

 特征向量feature vector:一个示例

并介绍了几个预测的模型运用:其本质是从输入空间到输出空间的映射

1.预测任务:监督学习

离散值的预测 —— 分类classification

连续值的预测 —— 回归regression,y=R

2.分类任务:监督学习

二分类问题binary classification —— 分为正类和反类,y=gif.latex?%5Cleft%20%5C%7B%20-1%2C+1%5Cright%20%5C%7Dgif.latex?%5Cleft%20%5C%7B%200%2C1%20%5Cright%20%5C%7D

多分类问题 multi-class classification ,gif.latex?%5Cleft%20%7C%20y%20%5Cright%20%7Cgif.latex?%3E2

3.聚类clustering:无监督学习,自动形成簇cluster

1.3 假设空间 :所有假设hypothesis组成的空间。以西瓜问题为例——

4d5c6b6671c442b894abfc77f0519f44.png

 版本空间:一个与训练集一致的“假设空间”

d8ba3364b04441d098be06bd0bd2212b.png

 

归纳学习inductive learning:从样例中学习的归纳过程,狭义上=概念学习,其中最基本的布尔概念学习,通过0/1布尔值判断。

1.4 归纳偏好

最基本原则——奥卡姆剃刀Occam’s razor:若有多个假设与观察一致,则选最简单的那个。

所以一般选择更平滑的曲线,但其泛化能力更为重要。

c3f7c815ab634667a09f4d174cf50117.png

但我们通过对所有可能的f按均匀分布对误差求和 ,发现总误差与学习算法无关!但是NFL定理有一个重要前提是所有f问题出现的机会相同,而实际情况并非如此。

f21f6315fef842e68c6518e1e0591191.png

 


 第二章 模型评估与选择

2.1 经验误差与过拟合

错误率(error rate) E=a(分类错误样本)/m(总样本)

精度(accuracy)=1-a/m

训练误差training error/经验误差empirical error:学习器在训练集上的误差

泛化误差generalization error:在新样本上的误差

过拟合overfitting

欠拟合underfitting

e0d180f680d04a00a0055085d91116a4.png

 2.2 评估方法

用测试集的测试误差作为泛化误差的近似。

【留出法hold-out】:将数据集D划分为两个互斥的集合,一个作为训练集S,另一个作为测试集T。在S上训练出模型后,用T来评估其测试误差。采用分层采样stratified sampling,一般2/3-4/5的样本用于训练。

【交叉验证法k-fold cross validation】:将数据集粗略地分为k个大小相似的互斥子集,即

20200416071839585.jpg#pic_center


然后取其中的一份进行测试,另外的k-1份进行训练,然后求得error的平均值作为最终的评价。5bf695fbf8b3400b927febf107552c09.png

 【自助法bootstrapping】:以自助采样bootstrap sampling为基础,计算得出初始数据集中仍约有36.8%的样本未出现在采样数据集中,这样的结果称为包外估计out-of-bag estimate。

【调参parameter tuning】

    验证集validation set:用于评估测试的数据集

2.3 性能度量performance measure

2.3.1错误率与精度

c0dc7543223543e59f35d2878d9f7cb6.png

68c53173035a471b9c3d283fa3d6bcdb.png

adefab367c014cae8b2fbfe8c65132a2.png

2.3.2查准率、查全率和F1 

d88541c2c38b425681c911dcc31a7506.png

 954480bd8bdf4a03a4f8cf55fd73bf84.png

a909ed94eecc4bb79ab37577aaf3d687.png

 

 平衡点Break-Event Point(BEP)是P=R时的取值,更常用的还有F1度量

eb54968bc34e4963ab68d0b3690da7b9.png

e041f90043c34080bae8cf7fb084b066.png

 先在个混淆矩阵上分别计算(Pn、Rn)在计算平均值,得到宏查准率macro-P、宏查全率macro-R和宏F1macro-F1

b7532149b83c48d69fe529c46b112834.png

 

 

 

a6dac5b8465f4f9380734cb9d004aefe.png

87f667ea458d442f91e244767602cf7e.png

2.3.3ROC与AUC

ROC受试者工作特征(Receiver Operating Characteristic)

其纵轴真正利率TPR(Ture Positive Rate)

横轴假正利率FPR(False Positive Rate)

AUC可通过对ROC曲线下各部分的面积求和而得=1-loss

损失loss则对应的是ROC曲线之上的面积

3c5fa77a855640f1a99c9dcf78ff5ac6.png

8b9b83fec00042dd970b3f820e48820f.png 

d15fbf089dd6458a86e29c27cf429bbb.png 

 

 

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值