持续更新的知识点
1、dataset:每个样本都是一个数据集dataset,是一个矩阵
每一行都是sample样本,每一列都是特征feature,一般最后一列是标记label/target,往往与特征分开,作为一维向量记录
2、从任务层面分类,每个复杂的问题都可以拆为两类任务完成
(1)分类任务:多分类任务和二分类任务,多分类任务可以向二分类任务转化
(2)回归任务:结果是一个连续的数字的值,比如成绩,而并不像分类任务那样是有类别划分的。回归任务也可以向分类任务转化,比如成绩归类
3、从学习层面分类
(1)监督学习:给机器的数据都是有标记与答案的,“回归任务和分类任务”大多都是这类学习范畴
(2)非监督学习:无标记情况下进行的分类聚合,可以通过特征提取、压缩PCA、降维等处理,随着数据量增大逐渐呈现一定的分类特征,转为监督学习,比如电商客户画像
(3)半监督学习:一部分标记,一部分无标记,同样向监督学习转化
(4)增强学习
:根据环境的反馈自我调整
4、其他分类
<