Lecture 3 : The Linear Model I
视频地址:https://www.youtube.com/watch?v=FIbVs5GbBlQ
输入形式
一个数据集:
每个数字尺寸是 16×16 16 × 16 ,也就是 256 256 个值。
‘raw’ input
X=(x0,x1,x2,...,x256)(x0=1)
X
=
(
x
0
,
x
1
,
x
2
,
.
.
.
,
x
256
)
(
x
0
=
1
)
linear model :
(w0,w1,w2,...,w256)
(
w
0
,
w
1
,
w
2
,
.
.
.
,
w
256
)
特征 : 提取有用的信息。
例如强度和对称性:
X=(x0,x1,x2)
X
=
(
x
0
,
x
1
,
x
2
)
此时
W=(w0,w1,w2)
W
=
(
w
0
,
w
1
,
w
2
)
x1
x
1
是强度 ,
x2
x
2
是对称性。下图是1和5的区别。
线性分类
PLA的应用:
-
Ein
E
i
n
和
Eout
E
o
u
t
的演化
- 最终的边界
- Pocket 算法
保存迭代过程中的最优解
线性回归
regression ≡ ≡ real-valued output
继续用银行信用举例
- 分类:是否有信用
- 回归:信用额度
Input: x x
年龄 | 性别 | 年薪 | 定居时间 | 债务 | … |
---|---|---|---|---|---|
23岁 | 男 | $30000 | 1年 | $15000 | … |
Output:
数据集: (x1,y1),(x2,y2),...,(xN,yN) ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N )
误差函数: 利用
(h(x)−f(x))2
(
h
(
x
)
−
f
(
x
)
)
2
Ein
E
i
n
的表示:
其中
最小化
Ein
E
i
n
X†是X的伪逆矩阵(以防X是非可逆矩阵) X † 是 X 的 伪 逆 矩 阵 ( 以 防 X 是 非 可 逆 矩 阵 )
关于伪逆矩阵
https://en.wikipedia.org/wiki/Generalized_inverse
https://en.wikipedia.org/wiki/Moore%E2%80%93Penrose_inverse
线性回归算法:
1.构建
X
X
矩阵和 矩阵
2.计算伪逆矩阵
X†=(XTX)−1XT
X
†
=
(
X
T
X
)
−
1
X
T
3.返回
W=X†Y
W
=
X
†
Y
线性回归也可以用于分类
非线性变换
线性是受限的,比如:
在银行信用额度示例里,居住年限是非线性影响额度的
将
(x1,x2)⟶Φ(x21,x22)
(
x
1
,
x
2
)
⟶
Φ
(
x
1
2
,
x
2
2
)
上图变为: