4.2 机器学习、人工智能、图像处理、图像识别导论
最近在看机器学习的书。之前一直搞不清这几个概念,而且以为都是某种“黑魔法”,但其实都是数学方法,所谓的什么“黑盒子”,其实也不黑。这些领域都是相互交错的,但每一个领域又方向不一样。
4.2.0 前导知识
上面提到许多都是数学方法,那么就需要先学习一些数学知识。将会用到的有:
- 微积分(高数)
- 线性代数
- 概率论与统计
- 离散数学(用的没有上面三门多)
下面介绍中我会指出上面这些数学的一些应用。
4.2.1 机器学习
以一个简单的线性回归的例子来直观解释一下什么是机器学习。
高中的时候不是有时候会要作线性回归图嘛(叫拟合还是什么来着),给你一些散点让你作一条线尽可能过最多的点。然后通过这条线我们就可以预测下一个x对应的y。
我们假设这条直线是 y = w x + b y = wx + b y=wx+b。机器学习中喜欢用w而不是k,w表示weight权重,b表示bias偏移,这对应了线代中的“仿射变换”概念,在这里不展开。
我们用 y i ‾ \overline{y_i} yi表示 ( w x i + b ) (wx_i + b) (wxi+b)的预测值,用 y i y_i yi表示每个点的实际值,那么每个点的误差就是 y i − y i ‾ y_i-\overline{y_i} yi−yi。我们把每个点误差(残差,用 e i e_i ei