1. 什么是机器学习
机器学习的定义:
计算机程序从经验E中学习解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。
对于跳棋程序来说:
a. 经验E就是计算机程序与自己下的几万次跳棋
b. 任务T就是玩跳棋
c. 性能P就是与新对手玩跳棋时赢得概率
目前主要有两种学习算法:
a. 监督学习:简单来说,监督学习就是我们教会计算机做某些事情
b. 无监督学习:在无监督学习中,我们让计算机自己学习做某些事情
2. 监督学习
监督学习是指:
a. 我们给算法一个数据集,其中包含了正确答案,监督学习算法的目的就是给出更多正确的答案。用更专业的术语来定义,它也被称为回归问题(regression problem)。回归问题一般用于预测连续值的输出。
b. 同样我们给算法一个离散的数据集,其中包含了不同的分类,监督学习算法的目的就是给出更多正确的分类。用更专业的术语来定义,它也被称为分类问题(classification problem)。分类问题一般用于预测离散值的输出。
3.无监督学习
无监督学习是指:
数据集中的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律。无监督学习应用最广的是聚类(clustering)。