机器学习绪论
机器学习概念
机器学习
- 有监督学习
- 如:回归,分类
- 无监督学习
- 如:聚类,降维
什么是机器学习
-
程序通过不断的学习达到一定的性能,可以完成指定的任务
-
定义
-
(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验 学习中改善具体算法的性能。
(2)机器学习是对能通过经验自动改进的计算机算法的研究。
(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准
-
-
机器学习的三个要素
- 模型(model):模型在未进行训练前,其可能的参数是多个甚至无穷的,故可能的模型也是多个甚至无穷的,这些模型构成的集合就是假设空间。
- 策略(strategy):即从假设空间中挑选出参数最优的模型的准则。模型的分类或预测结果与实际情况的误差(损失函数)越小,模型就越好。那么策略就是误差最小。
- 算法(algorithm):即从假设空间中挑选模型的方法(等同于求解最佳的模型参数)。机器学习的参数求解通常都会转化为最优化问题,故学习算法通常是最优化算法,例如最速梯度下降法、牛顿法以及拟牛顿法等
机器学习算法
- 监督学习 :房价预测 ( 回归 )
- 监督学习
- 正确价格
- 回归问题
- 预测价格
- 监督学习
- 监督学习 :垃圾邮件分类 ( 分类 )
- 监督学习
- y ∈ { 0 , 1 } y\in\lbrace 0,1\rbrace y∈{ 0,1} 0表示负向类 1表示正向类
- 分类问题
- 对邮件的好坏进行区分
- 监督学习
- 无监督学习 **:聚类 **
- 如:邮件分类 没有指定哪些是正向类,哪些是负向类,无监督学习可以将它们分为不同的簇,这就是聚类
- 如新闻分类,同一个新闻主题的多个报道网页都放到同一个簇别中一起展示,这就是聚类算法的应用
- 总结
- 监督学习:所用训练数据都是被标记过的
- 无监督学习:训练集中的所有数据都没有标记
补充
矩阵
由 m × n 个数 A i j A_ij Aij排成的m行n列的数表称为m行n列的矩阵,简称m × n矩阵。记作:
A = [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n a 31 a 32 ⋯ a 3 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ] A = \left[ \begin{aligned} a_{11} && a_{12} && \cdots && a_{1n} \\ a_{21} && a_{22} && \cdots && a_{2n} \\ a_{31} && a_{32} && \cdots && a_{3n} \\ \vdots &&\vdots && \ddots && \vdots \\ a_{m1} && a_{m2} && \cdots & &a_{mn} \\ \end{aligned} \right] A=⎣
⎡a11a21a31⋮am1a12a22a32⋮am2⋯⋯⋯⋱⋯a1na2na3n⋮amn⎦
⎤
这种 m × n m\times n m×n 个数称为矩阵 A A A 的元素 A i j = i , j A_{ij} = i,j Aij=i,j 代表 i 行 , j 列 i 行,j列 i行,j列
向量
´ 向量:在数学中,向量(也称为欧几里得向量、几何向量、矢量),指具有大小和方向的量。与向量对应的只有大小,没有方向的量叫做数量(物理学中称标量)
是一行或一列的特殊矩形,通常情况下,向量指列向量
向量:一个 n × 1 n\times 1 n×1 矩阵
Y = [ 11 21 31 40 ] Y = \left[ \begin{aligned}\ {11} \\ {21} \\ {31} \\ 40 \\ \end{aligned} \right] Y=⎣
⎡ 1121