机器学习概念
机器学习
- 有监督学习
- 如:回归,分类
- 无监督学习
- 如:聚类,降维
什么是机器学习
-
程序通过不断的学习达到一定的性能,可以完成指定的任务
-
定义
-
(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验 学习中改善具体算法的性能。
(2)机器学习是对能通过经验自动改进的计算机算法的研究。
(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准
-
-
机器学习的三个要素
- 模型(model):模型在未进行训练前,其可能的参数是多个甚至无穷的,故可能的模型也是多个甚至无穷的,这些模型构成的集合就是假设空间。
- 策略(strategy):即从假设空间中挑选出参数最优的模型的准则。模型的分类或预测结果与实际情况的误差(损失函数)越小,模型就越好。那么策略就是误差最小。
- 算法(algorithm):即从假设空间中挑选模型的方法(等同于求解最佳的模型参数)。机器学习的参数求解通常都会转化为最优化问题,故学习算法通常是最优化算法,例如最速梯度下降法、牛顿法以及拟牛顿法等
机器学习算法
- 监督学习 :房价预测 ( 回归 )
- 监督学习
- 正确价格
- 回归问题
- 预测价格
- 监督学习
- 监督学习 :垃圾邮件分类 ( 分类 )
- 监督学习
- 𝑦∈{0,1} 0表示负向类 1表示正向类
- 分类问题
- 对邮件的好坏进行区分
- 监督学习
- 无监督学习 **:聚类 **
- 如:邮件分类 没有指定哪些是正向类,哪些是负向类,无监督学习可以将它们分为不同的簇,这就是聚类
- 如新闻分类,同一个新闻主题的多个报道网页都放到同一个簇别中一起展示,这就是聚类算法的应用
- 总结
- 监督学习:所用训练数据都是被标记过的
- 无监督学习:训练集中的所有数据都没有标记