1、机器学习算法分类
监督学习:给出数据和标签进行训练,然后使用训练好的数据进行预测,分类等。监督学习中最常见的是两种问题,一种称为回归问题(线性回归和非线性回归),另一种称为分类问题,包含两类的分类问题,多个类的分类问题。
非监督学习:只给出数据,没有标签,让机器自己理解和分类。常见问题是聚类算法(K means clustering),图像的压缩(降维算法),PCA,Autoencoder等
半监督学习:结合监督学习和非监督学习
强化学习:把机器放入到一个陌生的环境,让其自己决策,然后给其决策进行打分,最后让机器朝着高分去走。
遗传算法:采用适者生存的思路,每次都保留最牛逼的那个结果。
2、机器学习基本流程
每个小模块都能引申出很多算法。
3、非监督学习
聚类算法:自动根据特征来分类
降低维度:特征选择,数据压缩,数据可视化
PCA算法:主成分分析,下面是PCA的基本算法