什么是机器学习(ML)?
计算机程序利用经验 E 学习任务 T,性能是 P,如果针对任务 T 的性能 P 随着经验 E 不断增长,则称为机器学习。
A computer program is said to learn from experience E with respect tosome class of tasks T and performance measure P, if its performance attasks in T as measured by P improves with experience E.
机器学习的发展
机器学习发展的驱动力:
- 数据
- 算法
- 算力
人工智能的三个主要流派
- 符号主义:使用符号、规则和逻辑来表征知识和进行逻辑推理,最具代表性的算法就是决策树。
- 连接主义:使用概率矩阵和加权神经元来动态地识别和归纳模式,神经网络就是连接主义的代表
- 行为主义(进化主义):生成变化,然后为特定目标获取其中最优的,典型方法为遗传算法。
关于机器学习的未来,随着OpenAl在2022年11月发布了ChatGPT,所有关于机器学习未来的讨论只有一个观点: 更强大、更通用的人工智能大模型。
机器学习系统的类型
- 是否在人类监督下进行训练
- 监督学习
- 无监督学习
- 半监督学习
- 强化学习
- 是否可以动态渐进学习
- 在线学习
- 批量学习
- 是否只通过比较数据点,还是通过训练建立一个预测模型
- 基于实例学习
- 基于模型学习
监督学习
- K近邻算法
- 线性回归
- 逻辑回归
- 支持向量机(SVM)
- 决策树
- 随机森林
- 神经网络
无监督学习
-
聚类
- K 均值
- 层次聚类分析(Hierarchical Cluster Analysis,HCA )
- 期望最大值
-
可视化和降维
- 主成分分析(Principal Component Analysis,PCA)
- 核主成分分析局部线性嵌入(Locally-Linear Embedding,LLE)
- t-分布邻域嵌入算法(t-distributed Stochastic NeighborEmbedding,t-SNE)
-
关联性规则学习
- Apriori 算法
- Eclat 算法
强化学习
- Model-free 和 Model-based(不理解环境 - 理解环境)
- Policy-based 和 Value-based(基于策略 - 基于价值)
- Monte-Carlo updated 和 Temporal-Difference updated(回合更新 - 单步更新)
- On-Policy 和 Off-Policy(在线学习 - 离线学习)