【西瓜书】Task1第1章&第2章

第一章 绪论

概念集合

data set 数据集
instance/sample 一条记录 (又称为特征向量feature vector)
attribute/feature 属性or特征
dimensionality 维数(属性的数量)
training data
training sample
ground-truth 真值
learner 学习器(模型别称)

prediction:(有label)
离散预测:分类 classification
连续预测:回归 regression

  • 二分类 binary classfication
  • 多分类

clusting(无label)
supervised learning
unsupervised learning
generalization

泛化能力:学习到的模型的预测能力

第二章 模型评估

2.1 经验误差与过拟合

error rate 错误率
accuracy 精度(准确率)
error 误差

实际预测输出和样本真实输出之间的差异

overfitting 过拟合
underfitting 欠拟合

过拟合,模型适用性差
欠拟合,模型学习能力差

2.2 training data and testing data

  1. 留出法
  2. 交叉验证法

均分n份,每个人都要当测试集

  1. 自助法 boostrapping

随机抽作为测试集,剩下的做训练集
优点:数据集小,难以划分训练/测试集的时候效果好

2.3 一些指标

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值