吃瓜教程 —— 第一、二章

这篇博客介绍了机器学习的基础知识,包括学习任务的分类、模型评估方法如留出法、交叉验证法和自助法,以及性能度量如错误率、精度、查准率和查全率。重点讨论了过拟合和欠拟合的概念,并强调了模型选择和调参的重要性。
摘要由CSDN通过智能技术生成

一. 绪论

1. 初识机器学习

1.1 基本术语
  1. 数据集,作为数据记录的集合;
  2. 示例(样本),关于一个事件或对象地描述;
  3. 属性(特征),反映事件或对象在某方面的表现或性质的事项;
  4. 属性值,属性上的取值;
  5. 属性空间(样本空间、输入空间,属性张成的空间;
  6. 特征向量,空间中的每一个实例。

训练集的介绍
从数据中学得模型的过程称为"学习"或"训练", 这个过程通过执行某个学习算法来完成.训练过程中使用的数据称为"训练数据",其中每个样本称为一个“训练样本", 训练样本组成的集合称为"训练集".

1.2 建立关于“预测”的模型任务
  • 当预测对象为离散值,称为“分类”任务;当预测对象为连续值,称为“回归”任务;
  • 当预测对象涉及两个,称为“二分类”任务,其中一个为“正类”,另一个为“反类”;当预测对象为多个时,称为“多分类”任务;
  • 将数据集中的数据分成若干组,每组称为一个“簇”,即聚类任务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值