1. 计算机学习理论
最重要的理论模型:
PAC (Probably Approximately Correct,概率近似正确)learning model
P
(
∣
f
(
x
)
−
y
∣
<
=
ϵ
)
>
=
1
−
δ
P(|f(x)-y|<=\epsilon) >= 1- \delta
P(∣f(x)−y∣<=ϵ)>=1−δ
机器学习本质 就是求解一个概率问题,找到概率问题的解。
比如 f(x) 可以是 根据特征来预估的label值,y是真实的label值。
机器学习的假设:
1. 未知分布
样本数据,服从一个分布,当然这个分布是未知的。
2. 独立同分布假设:
每个样本 都是独立的,并且是从同一分布产生的,也就是每个样本是独立随机事件,用这个独立随机事件出现的频率去逼近它的概率。
NFL定理:
NFL定理:
一个算法
ξ
a
\xi_a
ξa若在某些问题比另一个算法
ξ
b
\xi_b
ξb好,必存在另一些问题
ξ
b
\xi_b
ξb 比
ξ
a
\xi_a
ξa好。