1.1 绪论
机器学习
-Grew out of work in AI
-New capability for computer
应用领域:
Example
数据挖掘:网络点击数据,医疗记录,生物学,
无法手动编写的程序:直升机自动驾驶,手写识别,NLP,计算机视觉
私人定制程序:Amazon推荐商品
Understanding human learning:理解人类的学习过程
1.2 什么是机器学习
Arthur Samuel:在没有明确设置的情况下,使机器具有学习能力的研究领域。
Tom Mitchell: 计算程序从经验E中学习,解决某一任何T进行某要一性能度量P,通过P测定在T上的表现因经验E而提高。举个例子,垃圾邮件分类,任务T邮件分类,经验E观察是否把邮件分为垃圾邮件,性能度量P正确归类邮件的比例。
1.3 监督学习
例子:房价预测
监督学习:给算法的数据集,包含正确的答案,算法的目的就是给出更多正确的答案,监督学习包括回归和分类两种。例如房价预测的例子就是一种监督学习,更确切说是回归。回归(Regression)的定义:设法预测连续值的属性。
乳腺癌预测
肿瘤分类问题,单个属性。分类定义设法预测一个离散值输出。
肿瘤分类问题,多个属性。
1.4 无监督学习
例子:谷歌新闻 将成千上万的新闻聚类成不同的新闻专题,同一主题的为一个簇。聚类算法是无监督学习的一种。
无监督学习:给算法大量的数据,找出数据的类型结构。