Logistic regression回归 ( 也叫做 [logisti 模型 ] 或者 [logit 模型 ]), 被用于通过拟合一个 logistic curve 预测一个事件发生的概率
其为用于解决binomial regression( 二元回归 , 也就是最后的函数值为 2 元 ) 的广义线性模型 (generalized linear model). 就像别的形式的回归分析一样 , 它利用许多的预测变量 (predictor variables), 这些变量可以是数值或者分类的 . 例如 ....
l logistic function:
其中z 的范围是整个实数范围 . 而输出的结果则是在 (0,1) 之间 .
其表示的图形如下:
的
The variable z represents the exposure to some set of risk factors, while f(z) represents the probability of a particular outcome, given that set of risk factors. The variable z is a measure of the total contribution of all the risk factors used in the model and is known as the logit .
f(z), ; z表示总的 risk factors.
Figure 1. The logistic function, with z on the horizontal axis and f(z) on the vertical axis.
的
的
其中的变量z 一般用如下表示
其中的 β 0 表示截距(intercept)
β 1 , β 2 , β 3 分别表示 x 1 , x 2 , x 3 的回归系数(regression coefficients), intercept 是当所有的 risk factors 为 0 的时候的值 . 正向回归因子 (a positive regression)risk factor 增加输出的概率 ; 而负向回归系数 (a negative regression) 则是减少 . 大的回归系数意味着对于输出结果的影响大 ; 而接近 0 的回归系数意味着对于输出的结果影响较小 .
LR是一种比较有用的描述一个或者多个 risk factors(age,sex, etc.).