机器学习绪论

城府阳光

于 2024-07-14 22:53:28 发布

阅读量404

点赞数 16

文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/qq_45632142/article/details/140425016

版权

程序通过不断的学习达到一定的性能，可以完成指定的任务
定义
- （1）机器学习是一门人工智能的科学，该领域的主要研究对象是人工智能，特别是如何在经验学习中改善具体算法的性能。
  
  （2）机器学习是对能通过经验自动改进的计算机算法的研究。
  
  （3）机器学习是用数据或以往的经验，以此优化计算机程序的性能标准
机器学习的三个要素
- 模型（model）：模型在未进行训练前，其可能的参数是多个甚至无穷的，故可能的模型也是多个甚至无穷的，这些模型构成的集合就是假设空间。
- 策略（strategy）：即从假设空间中挑选出参数最优的模型的准则。模型的分类或预测结果与实际情况的误差（损失函数）越小，模型就越好。那么策略就是误差最小。
- 算法（algorithm）：即从假设空间中挑选模型的方法（等同于求解最佳的模型参数）。机器学习的参数求解通常都会转化为最优化问题，故学习算法通常是最优化算法，例如最速梯度下降法、牛顿法以及拟牛顿法等

监督学习 ：房价预测 ( 回归 )
- 监督学习
  - 正确价格
- 回归问题
  - 预测价格
监督学习 ：垃圾邮件分类 ( 分类 )
- 监督学习
  - 𝑦∈{0,1} 0表示负向类 1表示正向类
- 分类问题
  - 对邮件的好坏进行区分
无监督学习 **：聚类 **
- 如：邮件分类没有指定哪些是正向类，哪些是负向类，无监督学习可以将它们分为不同的簇，这就是聚类
- 如新闻分类，同一个新闻主题的多个报道网页都放到同一个簇别中一起展示，这就是聚类算法的应用
总结
- 监督学习：所用训练数据都是被标记过的
- 无监督学习：训练集中的所有数据都没有标记