吃瓜之路
第0章
-
范围划分:人工智能>机器学习>深度学习
-
人工智能具体应用领域:
- 计算机视觉CV:人脸识别
- 自然语言处理NLP:文本识别
- 推荐系统RS:分析喜好
-
数学基础推荐课程:张宇考研 数学系列(基础班)
第1章 绪论
-
假设空间和版本空间
假设空间:模型(如:y=3x-2)
版本空间:所有能拟合训练集的模型(假设)构成的集合 -
基本术语
算法:从数据中习得模型的具体方法,如:线性回归等
模型:算法产出结果
样本:一条事件的描述
向量:“;”列向量;“,”行向量
特征工程:中文数值化
标记:
样本空间和标记空间
根据标记取值类型,机器学习任务分类
- 分类:离散型标记
- 回归:连续性标记
根据是否用到标记信息,机器学习任务分类
- 监督学习
- 无监督学习
数据集:
模型:
泛化:对未知事物判断的准确与否称为泛化能力
分布:概率论中的概率分布
归纳偏好:不同的机器学习算法有不同的偏好
-
数据决定模型上限,而算法则是让模型无限逼近上限
数据量越大,模型效果越好;从特征工程的角度,对特征数值化越合理,特征收集越全越细致,模型效果越好。ChatGPT的数据庞大,质量高
数据相关工作准备充分,可用算法从数据学习潜在规律从而得到模型