根据数据集不同,可以吧机器学习算法分为:
监督学习
无监督学习
半监督学习
强化学习
1、监督学习
●定义:
输入数据是由输入特征值和目标值所组成。
■函数的输出可以是一个连续的值(称为回归),
■或是输出是有限个离散值(称作分类)
2、无监督学习
●定义:
输入数据是由输入特征值组成。
输入数据没有被标记,也没有确定的结果。样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类, clustering) 试图使类内差距最小化,类间差距最大化。
3、半监督学习.
半监督学习:即训练集同时包含有标记样本数据和未标记样本数据。
4、强化学习
强化学习:实质是,make decisions问题,即自动进行决策,并且可以做连续决策。
举例:
小孩想要走路,但在这之前,他需要先站起来,站起来之后还要保持平衡,接下来还要先迈出一条腿,是左腿还是右腿,迈出一步后还要迈出下一步。
小孩就是agent,他试图通过采取行动(即行走)来操纵环境(行走的表面),并且从一个状态转变到另-个状态(即他走的每- -步),当他完成任务的子任务(即走了几步)时,孩子得到奖励(给巧克力吃),并且当他不能走路时,就不会给巧克力。
主要包含四个元素: agent, 环境状态,行动,奖励;
上一步数据的输出是下一步数据的输入