机器学习是什么
定义:
第一个机器学习的定义来自于Arthur Samuel。他定义机器学习为,在进行特定编程的情况下,给予计算机学习能力的领域。
上述是个有点不正式的定义,也比较古老。另一个年代近一点的定义,由Tom Mitchell提出,来自卡内基梅隆大学,Tom定义的机器学习是,一个好的学习问题定义如下,他说,一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。我认为经验E 就是程序上万次的自我练习的经验而任务T 就是下棋。性能度量值P呢,就是它在与一些新的对手比赛时,赢得比赛的概率。
分类:
主要的两种类型被我们称之为监督学习和无监督学习。另外还包括强化学习,推荐系统等。
监督学习
数据集中的每个样本都有相应的“正确答案”。即数据集的每一个当本都有对应的标签,再根据这些样本作出预测。
监督学习(Supervised Learning):包括回归问题(regression)和分类问题(classification)
回归:这个词的意思是,我们在试着推测出这一系列连续值属性。
分类:其目标是推出一组离散的结果。
无监督学习
无监督学习中没有任何的标签。所以我们已知数据集,却不知如何处理,也未告知每个数据点是什么。别的都不知道,就是一个数据集。无监督学习通过从数据中找到某种结构,自动的将数据进行聚类,分成不同的簇。