理解监督学习
首先要理解“监督学习”中的“监督”二字,何为“监督”?监督是指数据中带有的“标签”,通常是对特征的判断,进行类别划分。比如橘子的甜或者不甜,音乐的喜欢或者不喜欢。标签又分数值型标签和“标称型标签”,如果目标变量是标称型的,那么该问题就是分类问题,例如一种药品药效的好与坏,我们可以用数字1代表药效的好,药效的坏用数字0代表,这样 y i ∈ { 0 , 1 } y_i \in \{0,1\} yi∈{0,1};如果目标变量是数值型,通常是连续型的,那么该问题通常就是回归问题,例如给定一个药品一段时间的售卖情况,对今后一周该药品的售卖的情况进行预测。综上所述,在监督学习中最后的数据结果是“有迹可循”的,是有目标的,通过使用大量数据,通过计算机对数据进行反复处理,最终能够产生接近正确答案标签的输出值。
理解无监督学习
与监督学习相反,在该类机器学习算法中数据是不会带有标签的,“聚类”是无监督学习的代表性方法(如下图),我们从下图可知改组数据被分为四类,每个颜色代表其中的一类,该类学习算法具有不存在所谓正确与否的答案的特点。
理解强化学习
实际上,除了监督学习和无监督学习以外,目前受关注较多的机器学习方法还有“强化学习”,在强化学习中也不需要监督,强化学习会提供“智能体”和“环境”。配备好智能体和环境后,智能体会根据环境的变化来采取相应的行动,环境根据行动的结果基于智能体一定的“报酬”,而智能体会根据其获取的报酬来对改行动作出“好”与“坏”的评价,并以此来决定下一次该如何采取行动。例如:围棋AI,象棋AI,机器人的操作和控制等。
往期文章: