一、什么是机器学习
1、基本定义
在没有明确设置的情况下,让计算机具有学习能力;让计算机不断学习某一类的问题,然后
利用大量学习的经验从而有基本解决这一问题的能力。
2、学习算法基本分类
(1)监督学习
人为教授计算机学习(目的明确,需要给数据打标签,可以衡量效果)。
(2)无监督学习
计算机自己学习(没有明确的目的,不需要给数据打标签,无法量化效果)。
(3)强化学习
(4)半监督学习
二、机器学习算法介绍(监督学习和无监督学习)
1、监督学习
(1)定义
给算法一个数据集,其中每一条数据都包含正确答案,而算法的目的就是给出更多的正
确答案;
(2)常见的监督学习算法
①回归分析(regression)
例:KNN(K-NearesNeighbor)临近算法:对于一个新的数据点,将计算其周围相
同距离内哪一类的数据点多,就把这个新数据点归为哪一类;
②统计分类(classification)
例:SVM(Support Vector Machine):找到一个决策边界来将两类样本分开(这
个决策边界距离两个样本各自最近的样本最远是最好的,这样的边界就叫做超平面);
2、无监督学习
(1)定义
输入的数据无标记,也无确定的结果,类别也未知,无监督学习则是没有明确目的的训
练方式,你无法提前知道结果是什么,根据样本间的相似性对样本集进行分类(聚类),尽
量做到让类内的差距最小化,类间的差距最大化。
(2)无监督学习算法的特点
①无监督学习没有明确的目的;
②无监督学习不需要给数据打标签;
③无监督学习无法量化效果;
(3)无监督学习的常见算法
①聚类算法
例:K-means:一开始随机选择k个样本作为聚类的中心,然后对每个数据集中的
数据都计算它到每个中心的欧氏距离,并将其分配到距离最小的聚类中心所属的类别
中,然后对每个类别都重新计算它的聚类中心,最后重复上面的步骤,直到达到某个终
止条件就停下;
②异常检测
③降维算法
本篇文章到此结束,感谢各位读者的阅读!