What is Machine Learning?
Tom Mitchell: “A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.”
基于Tom的定义,机器学习是利用对某任务T的学习来提升经验E,并通过效率P显示出。
Example: playing checkers.
E = the experience of playing many games of checkers
T = the task of playing checkers.
P = the probability that the program will win the next game.
机器学习分为监督学习与非监督学习
Supervised Learning
监督学习是基于已有数据集,数据集中的数据有特定分类,如:良性肿瘤,恶性肿瘤;且可以有无限个特征值,例如:肿瘤的大小、厚度、患者年龄……
而问题分为回归问题与分类问题。
分类问题(离散),例如:基于数据集与算法,判断特定数据的肿瘤是良性还是恶性
回归问题(连续),例如:预测未来三个月的衣服销量;给出有一些实际房子大小对应的房价的数据集,预测某一大小房子的房价。
Unsupervised Learning
非监督学习是基于已有数据集,数据集中的数据没有特定分类而只有特征值,通过特定的聚类算法,将数据集中的数据分为几个类型。例如:收集10000个不同的基因,并通过算法将这些基因按某个方面类似程度分类,比如寿命,地域,人种。
“鸡尾酒派对”中通过多个设备收录的声音而进行不同声音的分离是典型的非监督学习。