机器学习定义
机器学习没有一个确定的定义
Arthur Samuel将机器学习定义为:在没有明确设置的情况下,使机器具有学习能力的研究领域。
Tom Mitchell这样定义机器学习:一个适当的学习问题定义如下:计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。
监督学习
定义
监督学习指的就是我们给学习算法一个数据集。这个数据集由“正确答案”组成。
回归问题和分类问题
监督学习中有两类基本问题,回归和分类
回归问题:假设你的朋友买了一个新房子,我们给了一系列房子的数据,并给定数据集中每个样本的正确价格,即它们实际的售价,然后运用学习算法,算出更多的正确答案,比如你朋友那个新房子的价格。总结来说,回归问题就是通过回归来推出一个连续的输出。
分类问题:假设一个事件有五种情况,则可将这几种情况设为0,1,2,3,4,一个人处于此事件中,运用学习算法来估算处于某种情况的概率。总结来说其目的是推出一组离散的结果。
无监督学习
定义
在无监督学习中,我们已知的数据不同于监督学习的数据的样子,无监督学习中没有任何的标签或者是有相同的标签或者就是没标签。所以我们只知道一个数据集,但不知道如何处理。
针对数据集,无监督学习能判断出数据有不同的聚集簇。他们之间是不同的,无监督学习算法可能会把这些数据分成几个不同的簇。所以叫做聚类算法。
聚类应用的一个例子就是在谷歌新闻中。谷歌新闻每天都在收集非常多的网络的新闻内容。它将这些新闻分组,组成有关联的新闻。所以谷歌新闻做的就是搜索非常多的新闻事件,自动地把它们聚类到一起,然后把同一主题的显示到一起。
鸡尾酒宴问题
假设在一个鸡尾酒宴上,很多人都在说话,彼此的声音重叠,现在我们指定两个人,放两个麦克风在房间中,因为这两个麦克风在两个地方,离说话人的距离不同,所以每个麦克风记录下不同的声音,虽然是同样的两个说话人,但听起来像是两份录音被叠加到一起。
我们可以使用一个无监督学习算法来分离音频分别输出,或者将分离出来的音频合并输出
总结
第一节的知识点主要是一些定义和概念,注意理解吸收即可