- 机器学习简介
机器学习概念:让机器去学习样本数据的特征规律,属于白盒子模型,可解释性好。
-
- 机器学习流程
- 训练阶段:将大量带标签的学习样本喂给机器学习算法进行训练,得到模型。
- 预测/测试阶段:输入未知样本到模型,得到输出/预测结果。
- 机器学习与人工智能、深度学习的关系
- 机器学习(Machine Learning,ML)属于人工智能(Artificial Intelligence,AI)领域中的一个分支。
- 深度学习是机器学习中神经网络分支的延伸。
-
- 开发技术栈
- 开发语言:Python3
- 框架/模块:scikit-learn
- 其他:numpy、matplotlib、pandas
- 集成开发环境:Jupyter Notebook
- 数学:高等数学、概率论、线性代数、信息论等
- 相关术语
- 数据
- 相关术语
以公开的鸢尾花数据进行说明。其中的数据片段如下:
- 数据集
数据整体叫做数据集。
- 样本
每一行数据称为一个样本。
- 特征(属性)
除最后一列,每列表达样本的一个特征。
- 标签
最后一列称为标签,也叫标记。
-
-
- 主要任务
-
- 分类:二分类、多分类
- 回归:预测出连续值
-
- 方法分类
-
方式一:
- 监督学习
- 非监督学习
- 半监督学习
- 增强学习
方式二:
- 在线学习
- 批量学习
方式三:
- 参数学习
- 非参数学习