最近开始学习机器学习,在B站上找了视频,一边学习,一边记录,一边完成毕设。
机器学习解决的基本问题
1、分类
把一个输入映射为离散的类别
解决分类的算法有很多,比如KNN、支持向量机、决策树、朴素贝叶斯、逻辑回归、深度学习、图像分类、神经网络。
分类的评估指标,比如交叉熵、混淆矩阵、ROC、AUC、f1-score
2、回归
指的是要预测一个连续的值
回归可以用多种算法来解决,比如支持向量机、决策树、线性回归、岭回归、神经网络、以及我们很早以前学习的最小二乘。
3、聚类
把没有标签的数据自组织的聚成一簇,属于无监督学习
K-means聚类,谱聚类,DBSCAN 、核密度估计、高斯混合模型都可以解决聚类问题。
4、降维
把高维的数据压缩成2维或3维或者更低级的维度。如果压缩成为2维或3维,将便于我们的可视化。
强化学习
独立于监督学习和无监督学习
总结
离散&监督学习:分类
离散&非监督学习:聚类
连续&监督学习:回归
连续&非监督学习:降维