学习机器学习有一段时间了,所以想记一下关于机器学习的笔记
机器学习基础
关于数据
- 数据整体叫数据集
- 每一行是数据成为一个样本
- 除最后一列,每一列表达样本的一个特征
- 最后一列,称为标记
花瓣长度,花瓣宽度等就是特征,下面的数据为特征向量
特征的分布称为特征空间,分类任务的本质就是在特征空间切分
对于图像来说,每一个相随点都是特征,如3*5的图像就是有15个特征
机器学习的基本任务
主要是分类任务和回归任务
分类任务
- 二分类任务:如合法邮件和垃圾邮件的分类
- 多分类任务:如数字识别和图像识别
- 多标签分类
回归任务
结果是一个连续数字的值,不是类别
回归任务可以简化成为分类任务