p=c1p′−1+c
p
=
c
1
p
′
−
1
+
c
- c∼(0,1] c ∼ ( 0 , 1 ] : 负样本采样比例。如果正负样本都采样,采样比分别为 c1,c2 c 1 , c 2 , 则 c=c2/c1 c = c 2 / c 1
- p′ p ′ :使用有采样的样本预估的ctr
- p p :修正ctr(理论真实值)
特性
- 推导方法, 可用 得到
- 对于 logistic regression,
p′=11+exp(−wx)=σ(wx)
p
′
=
1
1
+
e
x
p
(
−
w
x
)
=
σ
(
w
x
)
,可直接在此函数中修正:
p=σ(wx+lnc) p = σ ( w x + ln c ) - 通常情况 p′ p ′ 值较小,在 p′→0 p ′ → 0 时有 dpdp′=c d p d p ′ = c ,此时可近似: p=cp′ p = c p ′
- 相反 p′ p ′ 接近于 1 时,有近似: p=p′/c p = p ′ / c
- 函数曲线: