提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的分类。
一、监督学习
监督学习指的是人们给机器一大堆标记好的数据,比如:
- 一大堆照片,标记出哪些是猫的照片,哪些是狗的照片
- 让机器自己学习归纳出算法或模型
- 使用该算法或模型判断出其他没有标记的照片是否是猫或狗
- 监督学习典型模型:Linear regression 线性回归、Logistic regression 罗切斯特回归、SVM 支持向量机 、Neural network 神经网络 等
1.1分类问题
-
是监督学习的一个核心问题 。在监督学习中:
- 当输出变量Y取有限个离散值时,预测问题便成了分类问题,比如预测一封邮件是否为垃圾邮件,顾客买不买东西 ,等等
- 监督学习从数据中学习一个分类模型或分类决策函数,称为分类器(classifer)
- 分类器对新的输入进行输出的预测(prediction),称为分类(classification)
- 在学习过程中,根据已知的训练数据集利用有效的学习方法学习一个分类器
- 在分类的过程中,利用学习的分类器对新的输入实例进行分类。
- 输出变量为有限个离散值的情况称为分类问题(classification)
- 如果类别为正类或负类的时候,这个是一个二分类问题
- 如果类别是一个多类别的时候,这就是一个多分类问题
1.2回归问题
另一类监督学习方法针对连续型输出变量进行预测,也就是所谓的回归分析(regression analysis)。回归分析中,数据中会给出大量的自变量和相应的连续因变量(对应输出结果),通过尝试寻找自变量和因变量的关系,就能够预测输出变量。
比如生活中常见的房价问题:
- 横轴代表房屋面积,纵轴代表房屋的售价
- 我们可以画出图示中的数据点,再根据使得各点到直线的距离的平均平方距离的最小,从而绘制出下图的拟合直线
- 根据生活常识随着房屋面积的增加,房价也会增长
总结
以上是对机器学习的分类和回归问题的概述,如果问题,欢迎交流,谢谢大家