先来看看思维导图:
引出分类与回归的问题
分类 (classification):
目标标记为类别型数据(category)
回归(regression):
目标标记为连续性数值 (continuous numeric value)
机器学习分类 - 1
根据是否是连续值得预测,分为
一.机器学习分类
分类问题–离散值预测,如小明学习水上运动
回归问题–连续值预测,如房价预测
二.机器学习处理问题框架
将数据集切分为训练集和测试集
通过训练集训练模型
通过测试集测试模型,给出评价指标
ex:
按照小明享受运动来理解:
100 天: 训练集
10天:测试集 (不知道是否 ” 享受运动“, 知道6个属性,来预测每一天是否享受运动)
例子:肿瘤良性,恶行于尺寸,颜色的关系
特征值:肿瘤尺寸,颜色
标记(labels):良性/恶性
有监督学习(supervised learning):训练集有类别标记(class label)
无监督学习(unsupervised learning):无类别标记(class label)
半监督学习(semi-supervised learning):有类别标记的训练集+无标记的训练集
机器学习分类 - 2
根据是否是连续值得预测,分为
一.机器学习分类
分类问题–离散值预测,如小明学习水上运动
回归问题–连续值预测&