先抛出个例子,根据房子的面积来判断房子的价格。
什么是监督学习,大概了解就是有标准答案的训练,比如上面那个房子的问题,之前给的training examples都是一个x对应特定的y,就相当于有标准答案,这就是监督学习。supervised learning(我理解的)
无监督学习就是没有标准答案的,往往是会根据数据的某些特征分类,分群。(clustering)
强化学习 reinforcement learning,又称奖励学习,评价学习,key reward function。原理和训练狗一样。你做的对了,就表扬,给肉吃,你做错了,就打。