DataWhale - 吃瓜教程学习笔记（一）

司南锤

已于 2024-06-28 19:52:12 修改

阅读量936

点赞数 22

分类专栏： AI python机器学习文章标签：学习笔记

于 2024-06-16 21:08:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52964132/article/details/139726330

版权

学习视频：第1章-绪论_哔哩哔哩_bilibili
西瓜书对应章节：第一章 & 第二章

文章目录

机器学习三观
基础核心知识概念
数据决定模型的上限，算法则是让模型无限逼近上限
- - - - 数据决定模型的上限
模型评估与选择

机器学习三观

What：什么是机器学习？

关键词：“学习算法”

Why: 为什么要学机器学习？

1. 机器学习理论研究

2. 机器学习系统开发

3. 机器学习算法迁移（AI+）

4. AI 应用方向研究：NLP, CV, 推荐系统

How: 怎样学习深度学习？

- 纯理论研究

- 系统的开发

1C6PR5L3A4ALU899PL%6V.png

- 算法迁移（AI for Science)

- AI 应用方向研究

基础核心知识概念

假设空间 & 版本空间

假设空间定义了所有可能的解决方案；版本空间则是在考虑了训练数据后，认为可能正确的解决方案的集合

算法

从数据中学得模型的“具体方法”，其产出结果称为“模型”

样本（示例）

关于一个事件或对象的描述。用向量进行表示，向量中的各个维度称为“特征”或“属性“。向量中的元素用分号 “;” 表示为列向量，用逗号 ","表示为行向量。

标记

学习样本在某方面的表现存在潜在规律的的信息。

样本空间 & 标记空间

所有可能的输入数据或特征向量的集合；
所有可能的输出标签或目标值的集合

机器学习任务分类（根据标记取值类型不同）

标记取值为“离散型”，任务为分类
标记取值为 “连续型”，任务为回归

机器学习任务分类（根据是否用到标记信息）

训练阶段有用到标记信息，此类任务为 “监督学习”
训练阶段没用到标记信息，此类任务为 “无监督学习”

数据集

通常用集合表示
一般同一份数据集中的每个样本都含相同个数的特征
样本 $x_{ij}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

司南锤 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。