西瓜书第一第二章理解

第一章

机器学习的整体流程:
1.确定数据集

确定特征向量和属性

2.通过某种算法进行学习和训练

3.得到模型(有监督:分类,回归,无监督:聚类)

4.进行预测

奥卡姆剃刀原则
如果多个假设与观察一致,选择最简单的那个

NFL定理(无免费午餐)
如果某类问题分布是离散均匀的,则任何算法的期望均相同,即期望与算法性能无关
所以需要具体问题具体分析,不同算法在不同问题情况下各有优劣

第二章

(不会打公式😅)

经验误差与过拟合
错误率
精度
误差

评估方法
泛化能力:对没见过的数据的预测能力

数据集划分方法:
1.留出法(三七分,二八分)
缺点:训练集与测试集容易不同分布

2.交叉验证法(K折交叉验证法)
缺点:数据较大时,对算力要求高

3.自助法
缺点:会改变初始数据分布,引入估计偏差

数据集划分类别:
1.训练集(用来训练模型的数据集)
2.测试集(用来验证模型的数据集)
3.验证集(用来调整模型参数的数据集)

性能度量

均方误差
所有预测结果与真实结果的差的平方的和

错误率
预测结果与真实结果不同的数量在总数中的比例

精度
正确结果在总数中的比例

查准率P
预测结果里有多少是对的

查全率R
预测的正例中有多少是真的正例

P-R曲线
可以看出P和R的反向变动关系,不可兼得

BEP平衡点
R=P时R与P的值

F1度量
基于P和R的调和平均数

F beta度量
是P和R的加权调和平均,F1的一般形式

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值