回归可以做什么
- 股票预测:输入是股票信息,输出的是明天的Dow Jones Industrial
- 无人车驾驶:输入是各种tensor,输出是方向盘角度
- 推荐系统:输入是使用者A和商品B,输出是购买的可能性
机器学习的三个步骤
Step1:Model
- 假设是 y = b + w * x c p x_{cp} xcp 用其来代表这一系列function的集合
- 那么这一系列的function就可以为:f1: y = 10.0 + 9.0 * x c p x_{cp} xcp 或 f2: y = 9.8 + 9.2 * x c p x_{cp} xcp等等
- Linear Model: y = b +
∑
w
i
x
i
\sum w_ix_i
∑wixi
- x i x_i xi: an attribute of input x (feature)
- w i w_i wi: weight
- b b b: bias
Step2:Goodness of Function
- 需要有一个training data,然后通过loss function来定义Function f的好坏
- Loss function L:input: a function, output: how bad it is
- L(f) = L(w,b) 所以可以说Loss function L是在衡量一组参数w和b的好坏
Step3:Best Function
-
f
∗
=
a
r
g
m
i
n
f
L
(
f
)
f* = arg min_f L(f)
f∗=argminfL(f)
- Gradient Descent
- 在Linear Model是没有Local optimal的
- 过拟合
- A more complex model does not always lead to better performance on testing data
- 正则化