监督学习
对已经标记的训练样本进行学习,然后对样本外的数据进行标记预测。
比如分类垃圾邮件,需要对训练样本的邮件进行标记,所谓标定,就是每一封邮件都要人为去制定,然后通过学习,模型对新来的邮件判断其是否是垃圾邮件。
现实中的主流应用都是监督学习。
对标记好的数据用模型学习。
非监督学习
对没有标记的训练样本进行学习,发现其中的结构性知识。
比如把进店购买商品的顾客进行聚类,将他们划分成不同的细分市场。
强化学习
可以理解为一个机器人不断依据环境做决策,然后环境根据决策进行奖励或者惩罚机器人就根据环境给予的反馈来学习的方式。
比如小时候,你放学回家没有做作业就出去玩,然后就被妈妈教训了,第二次又这样,又被教训了,第三次你就会根据前面的反馈知道应该先做作业,然后妈妈就奖励了你一个糖果,接着第四次你就会先做作业,这就是一个强化学习的过程举例。