更详细请参考:
http://blog.sina.com.cn/s/blog_44befaf60102vznn.html
https://www.douban.com/note/352258282/
直接举例子:
当为二分类时(二元Logistic):
假设数据如下:
Health代表身体健康情况,1是健康,0是不健康;
Aag代表年龄组,1是青年人,2是中年人:
Health | Age |
---|---|
1 | 1 |
1 | 1 |
1 | 1 |
1 | 1 |
0 | 1 |
1 | 2 |
1 | 2 |
0 | 2 |
0 | 2 |
0 | 2 |
0 | 2 |
青年人里,4个健康1个不健康;
中年人里,2个健康4个不健康
相当于下表,第一行是健康,第二行是不健康
Young | Middle | |
---|---|---|
Healthy | 4 | 2 |
Unhealthy | 1 | 4 |
现在分析,健康和不健康这两种身体状况,哪一种更容易出现在z中年人身上
P(健康中年人的概率) = 2/6=1/3
P(不健康中年人的概率) = 4/5
对于中年人而言,
Odds(健康) = 1 / 3 1 − 1 / 3 \frac{1/3}{1-1/3} 1−1/31/3 = 1 2 \frac{1}{2} 2