【一起啃书】机器学习西瓜书白话解读——01绪论

全书章节

在这里插入图片描述

0101 绪论基本概念

1.1 引言

机器学习解决了一个什么问题?

  • 通过计算的手段,利用经验来改善系统自身的性能
  • 有了数据
  • 通过某种学习算法
  • 得到模型
  • 进行预测

1.2 基本术语

有了数据

  • 数据集,例如100个西瓜
  • 样本,例如1个西瓜
  • 特征向量
    特征向量张成了样本空间
    如果特征向量有颜色、大小、敲起来的振幅,那么维度就是三维,样本空间就是三维坐标系那样的
  • 属性,特征向量中的一个,例如颜色

通过某种学习算法

  • 从数据中学得模型的过程称为学习训练,这个过程通过执行某个学习算法来完成

得到模型

有监督学习无监督学习
训练数据有标记 ,有正确答案训练数据无标记,无明确答案
包含分类和回归包含聚类
  • 分类:欲预测的是离散值,如“好瓜”,“坏瓜”

    • 二分类:只涉及2个类别——正类和负类,例如判断一个瓜熟不熟,该不该摘
    • 多分类:结果涉及多个类别,例如有黑美人、小地雷、特小凤3种西瓜,买哪种
  • 回归:欲预测的是连续值,如西瓜甜度0.95、0.37

    • 也可以根据往年西瓜价格走势,预测明年的各个时间段西瓜的价格
      在这里插入图片描述
  • 聚类:我们不知道要分几类,机器自己分

    • 每个组称为“”(cluster)

进行预测

  • 测试:学的模型后,使用其进行预测的过程
  • 测试样本:被预测的样本
  • 泛化能力:学的模型适用于新样本的能力。具有强泛化能力的模型能很好地适用于真个样本空间

0102 假设空间归纳偏好

1.3 假设空间

科学推理的能力

  • 归纳:特殊到一般
  • 演绎:一般到特殊

在这里插入图片描述

1.4 归纳偏好

在这里插入图片描述
模型越简单,越能体现本质
就像数学公式一样

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值