假设1: P(y|x) = p = p(y|!x)
假设2:P(y|x) = p1 != p2 = p(y|!x)
其中1表示二者独立,2表示不独立。
似然比主要是用来描述二者的依赖程度,也就是假设2的程度
假设是二项分布
cx, cy, cxy表示出现次数,N表示总次数,估计p p1 p2。
对已H1(假设1):
p(y|x) = cy/N
p(y|!x) = cy/N
条件cx下cxy的二元组xy b(cxy, cx, p)
条件N - cx下cy - cxy的二元组!x y: b(cx - cxy, N - cx, p)
对已H2(假设1):
p(y|!x) = c(y, !x)/c(!x) = (cy - cxy)/(N - cx)
p(y|x) = cxy/cx
p(y|!x) = (cy - cxy)/(N - cx)
条件cx下cxy的二元组xy b(cxy; cx, p1), cxy为随机变量
条件N - cx下cy - cxy的二元组!x y: b(cx - cxy;N - cx, p2) cx-cxy为随机变量
L(H1) = b(cxy; cx, p)*b(cy - cxy; N -cx, p)
L(H2) = b(cxy; cx, p1) *b(cy - cxy; N - cx, p2)
表示什么含义?
似然比:
logr = Log(L(H1)/L(H2))
如果这个值很大,说明二者是依赖的的