什么是机器学习?
从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。
用图来表示则如下:
机器学习适用于什么情况?
统计学习,模式识别,数据挖掘,计算机视觉,语音识别,语言处理等等。、
机器学习常见的模型有以下几种:
监督学习
通俗来讲,监督学习就是在数据集上给机器一个标准答案,让机器照着这个标准答案来训练,训练得出的模型再来预测新的数据。
比如在你小的时候,父母会告诉你这是一只猫和这只猫所拥有的特征,之后你再遇见猫,你就可以很清楚的知道这是一只猫,这是因为父母给了你标准答案让你进行了学习。
常用的监督学习方法有:KNN,SVM等等。
无监督学习
通俗来说,无监督学习就是不给机器标准答案,让机器直接学习和训练,得到模型后再来预测新的数据。
比如在你小的时候,看见加菲猫,波斯猫,短尾猫等等,但是没有人告诉你这是什么,经过不断的学习和观察他们的外观,你会把它们归为一类动物。
无监督学习方法:K均值,聚类等等。
半监督学习
为了提高训练精度,人们往往会给数据打标签,但由于有时候数据集太大,人工打标签的成本又太高,这时候则可以使用半监督学习,给数据集的一部分打标签,另一部分则不打标签,用打了标签的数据集训练一个分类器,然后用这个分类器去分类没有标签的数据集,对于计算机有一定的把握认为分类正确的则放入打了标签的部分,从而再进行分类器的训练,不断提高分类器的精度。
比如在你小的时候,父母只告诉你这是一只猫,然后需要你分辨一群动物,里面有猫有狗有猪,这时候你就会从父母告诉你的那只猫上获取特征,来分辨这群动物里的猫。
半监督学习方法有:self training,Generative model等等。