机器学习基本概念

机器学习

一.基本术语

  1. 数据集(data set)
  2. 样本空间(属性张成的空间)
  3. 示例(样本 特征向量)
  4. 训练集(训练样本的集合)
  5. 测试样本
  6. 学习器(模型)

二.学习

学习过程:在所有假设组成的空间进行搜索,搜索目标是找到与训练集匹配的假设。

这里写图片描述

三.机器学习分类

  1. 监督学习(训练样本拥有标记信息)
    1. 离散值 分类
    2. 连续值 回归
  2. 无监督学习 聚类

四.模型评估与选择

分类 错误率/精度 等等

回归 均方误差

实际预测与真实输出之间的差异:误差

训练集上的误差 训练误差/经验误差

新样本上的误差 泛化误差

过拟合/欠拟合

评估方法 留出法 交叉验证法 自助法

很多学习器是为测试样本产生一个实值或者概率预测,然后将这个预测值与一个分类阈值进行比较,若大于阈值则为正类,否则为反类。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值