机器学习是人工智能的一个分支,它使计算机系统能够从数据中学习并做出决策或预测。机器学习可以根据不同的标准进行分类,以下是一些常见的分类方式:
一、按学习方式分类
- 监督学习(Supervised Learning)
- 定义:利用已标注的训练数据集来训练模型,然后用这个模型对新数据进行预测。
- 特点:算法从标记的训练数据中学习,这些数据包括输入特征和期望的输出标签。目标是学习一个函数,该函数能够预测新数据的输出标签。
- 常见任务:分类(如垃圾邮件检测、手写数字识别)和回归(如房价预测)。
- 常见算法:支持向量机(SVM)、k近邻算法(k-NN)、决策树、随机森林、朴素贝叶斯、神经网络等。
- 无监督学习(Unsupervised Learning)
- 定义:在没有标签的数据上训练模型,以发现数据的结构或分布。
- 特点:算法的目标是从未标注的数据中发现数据的结构或模式。
- 常见任务:聚类(如市场细分)、降维(如主成分分析)和异常检测。
- 常见算法:k均值聚类、层次聚类、DBSCAN、高斯混合模型(GMM)、主成分分析(PCA)等。
- 强化学习(Reinforcement Learning)
- 定义:智能系统在与环境的连续交互中学习最佳行为策略的机器学习问题。
- 特点:智能系统通过观测环境状态、选择动作并接收奖励来优化其行为策略,目标是最大化长期累积奖励。
- 应用场景:机器人学习行走、AlphaGo学习下棋等。
- 半监督学习(Semi-supervised Learning)
- 定义:包含大量未标注数据和少量标注数据的机器学习问题。
- 特点:主要是利用未标注数据中的信息,辅助标注数据进行监督学习。
- 常见算法:深度信念网络(DBN)等。
- 主动学习(Active Learning)
- 定义:机器不断给出实例进行人工标注,然后使用标注数据学习预测模型的机器学习问题。
- 特点:目标是对学习最有帮助的实例进行人工标注,以较小的标注代价达到最好的学习效果。
二、按模型类型分类
- 概率模型
- 定义:模型可以表示为联合概率分布的形式。
- 代表:贝叶斯、马尔可夫随机场、条件随机场等。
- 非概率模型
- 定义:模型不一定能表示为联合概率分布的形式。
- 代表:决策树、支持向量机、神经网络等。
三、按算法特性分类
- 线性模型
- 定义:模型是输入特征的线性组合。
- 代表:线性回归、逻辑回归等。
- 非线性模型
- 定义:模型是输入特征的非线性组合。
- 传统机器学习模型:SVM、KNN、决策树等。
- 深度学习模型:神经网络(如卷积神经网络CNN、循环神经网络RNN等)。
四、按学习理论分类
机器学习还可以按照学习理论进行分类,包括有监督学习、半监督学习、无监督学习、迁移学习和强化学习等,这与前面按学习方式分类中的部分内容是重叠的。
总结
机器学习的分类方式多种多样,每种分类方式都有其独特的视角和应用场景。在实际应用中,需要根据具体问题和数据特性选择合适的机器学习方法和算法。
虽然现在AIGC有了很大的发展,在现实的工作中,完成特点的任务,机器学习还是有很多用武之地的,特别是对准确率和召回率比较高的场景,机器学习完成特定任务还是有他的优势的,后续我会用AI来辅助自己提升机器学习方面的知识,不断和大家分享。