以下所有学习内容源于李宏毅老师的《机器学习》一课,
-----------------------------------------
机器学习即系统通过执行某个方式改进它的性能,在我的理解就是让计算机或者机器人拥有自主学习的能力。完整的机器学习过程离不开data,机器学习的对象也是data,包括数字、文字、图像、语音或者它们的组合。数据的集合也就是我们说的数据集(dataset),数据集根据使用方法又会分为训练(train)数据集和测试(test)数据集。
机器学习的前提是数据具有一定的统计规律性。
机器学习包括监督(supervised)学习、无监督(unsupervised)学习、强化(reinforcement)学习、半监督(semi-supervised)学习、主动(active)学习等
-----------------------------------------
监督学习:从标注数据中学习到预测模型的机器学习,即给定输入能够产生一定客观的输出
监督学习输入输出的可能值叫做输入、输出空间,每一个具体的输入由特征向量表示,所有特征向量的空间叫做特征空间,有时输入空间与特征空间相等,有时也不一定想等,不过模型都是定义在特征空间上的。
监督学习由两部分完成,一是学习系统一是预测系统。
-----------------------------------------
无监督学习:从无标注数据中学习预测模型的机器学习问题,本质是学习数据中的统计规律或潜在结构
强化学习:智能系统在与环境的连续互动中学习最优行为策略的机器学习问题
半监督学习:利用标注的数据和未标注的数据学习预测模型的机器学习问题
主动学习:机器不断主动给出实例让教师进行标注,然后利用标注数据学习预测模型的机器学习问题
以上即机器学习初探第一天学习的内容,主要介绍的了什么是机器学习以及分类
全文涉及的概念来自李航著《统计学习方法》一书,有兴趣的船游可以自行翻阅