根据当前AI发展趋势,选择一些经典的机器学习(machine learning,后续可能简称为ML)进行学习,放弃一些当前比较落伍冷门的机器学习内容。
一、分类KNN和聚类Kmeans
了解监督学习和无监督学习,学会标签在KNN(监督学习)当中的作用。
二、树模型
数据分析必备,可视化展示很不错。
三、线性/逻辑回归
虽然比较简单,但是比较重要,可以理解为‘单层神经网络’。
1.线性回归:
○概念:寻找输入特征与连续输出之间的线性关系。
○应用:预测房价、销售预测等。
2.逻辑回归:
○概念:处理二分类问题,输出是0或1的概率。
○应用:垃圾邮件分类、疾病预测等。
四、集成算法
集成算法是一种思想,我们考虑问题的时候可以将多个基本学习算法组合起来,以获得更好的预测性能或更稳健的结果。
比方说 随机森林 模型,就是由多个决策树组成的集成模型。
五、支持向量机SVM
个人感觉和神经网络差不多,许多实验文章上指出小数据集上SVM有时表现会优于神经网络,但用的较少,但面试会经常问道。
六、贝叶斯
入个门,学《概率论与数理统计》会学到贝叶斯原理。
贝叶斯算法在机器学习中的应用:
1.朴素贝叶斯分类器:用于分类问题,假设特征之间条件独立。通过观察特征的先验概率和给定类别的条件概率,计算后验概率,以预测新数据点的类别。
2.贝叶斯网络:描述随机变量之间的依赖关系,并使用图模型来表示变量之间的条件依赖关系。在推断中,可以利用贝叶斯网络进行概率推理。
3.贝叶斯优化:在优化问题中,贝叶斯优化通过建模目标函数,并结合先验知识和观察结果,寻找最优解。