吃瓜教程Task01

西瓜书第1章一些重点概念mark:

  1. 记录:(色泽=青绿;根蒂=蜷缩;敲声=浊响),(色泽=乌黑;根蒂= 稍蜷;敲声=沉闷),每对括号内是一条记录

每条记录是关于一个事件或对象的描述,为一个“示例” (instance)或“样本” (sample),

可把一个示例称为一个“特征向量”

  1. 特征:反映事件或对象在某方面的表现或性质的事项

  1. 输入空间:属性张成的空间,或为样本空间,属性空间

  1. 假设:从数据中学得模型的过程称为“学习” (learning)或“训练”(training), 这个过程通过执行某个学习算法来完成.学到模型对应了关于数据的某种潜在的规律,即“假设” (hypothesis);学习过程就是为了找出或逼近真相.也可以称为“学习器” (learner),可看作学习算法在给定数据和参数空间上的实例化.

  1. 标记” (label):是示例的结果,拥有了标记信息的示例,则称为“样例” (example)

  1. 输出空间:标记的空间

  1. 分类:预测的任务是离散值

  1. 回归:预测的任务是连续值

  1. 泛化能力:学得模型适用于新样本的能力

  1. 独立同分布” (independent and identicallydistributed,简称i.i.d.):

通常假设样本空间中全体样本服从一个未知“分布“ D, 获得的每个样本都是独立地从这个分布上采样获得的

训练样本越多,我们得到的关于D的信息

  1. 归纳偏好:对应了学习算法本身所做出的关于“什么样的模型更好”的假设.在具体的现实问题中,这个假设是否成立,

算法的归纳偏好是否与问题本身匹配, 大多数时候直接决定了算法能否取得好的性能.

  1. 奥卡姆剃刀” (Occam's razor)原则:若有多个假设与观察一致,则选最简单的那个

  1. NFL定理:推导有点复杂,还没完全搞懂,后面需要反复再琢磨

西瓜书第2章 模型评估与选择 关键概念mark

  1. 误差:模型预测结果与真实结果之间的差异

  1. 泛化误差:在未知样本上得出的误差

  1. 查准率:TP/TP+FP

  1. 查全率:TP/TP+FN

  1. ROC:真正例率关于假正例率的变化曲线

  1. AUC:ROC曲线下的面积

初步看了一下1,2章,还有很多关键点需要再消化补充,未完待续....

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值