[DataAnalysis]定序回归模型OLM深入浅出

最新推荐文章于 2022-03-31 00:04:08 发布

TOMOCAT

最新推荐文章于 2022-03-31 00:04:08 发布

阅读量3.7w

点赞数 2

分类专栏：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TOMOCAT/article/details/81174161

版权

数据分析专栏收录该内容

47 篇文章 2 订阅

订阅专栏

一、为什么使用定序回归：

定序变量介于连续变量和定类变量之间，是在测量层次上被分为相对次序的不同类别，但并不连续。

如果对定序变量使用多分类logit模型（MNL），那么会无视数据内在的排序从而导致排序信息的缺失，使得统计结果因为遗漏掉排序信息而丧失统计效率。如果采用OLS，那么就是将定序变量作为连续变量处理，会导致人为的信息膨胀。因此，针对定序因变量，需采用对应的模型即定序logit/probit模型（ordered logit/probit model,OLM）。

二、模型：

当我们评价某产品组合时，会形成对一个产品的喜好程度记为Z，其为连续的，而要把对产品的喜好程度形成消费者的打分就需要在人们的心理活动中有一定的判断标准或者叫做阈值Ck，喜好落在某两个相邻阈值之间就给出一定的打分。如下所示：

如果假设解释性变量是通过影响喜好程度来影响消费者打分，则Z是一个取任意值的连续型变量，我们用普通线性回归模型来刻画Z与解释性变量如W之间的关系

从而判断分数不超过k的概率就是

其中，是ɛ的分布函数，那么我们获得了一个关于定序变量的回归模型，如下所示：

我们应该首先注意到该模型与0-1回归的异同，由于定序数据可能取值大于2，因此会有好几个不同的截距。例如隐变量scores有五种不同的取值，从而总共有四个不同的截距，并且截距之间有顺序：，但是斜率只有一个即β，对于实际问题，我们更关系解释性变量和因变量之间的关系而对截距项的兴趣不大。还需要考虑的具体形式应该如何假设才比较合理。

有一个方便的假定是把假设成标准正态分布和逻辑分布，分别对应于probit定序回归和logit定序回归。模型形式分别是：

等价表示成：

同0-1变量回归一样，probit定序回归和logit定序回归之间孰优孰劣至今没有定论，但是都是非常有用的统计方法，并且统计结果往往极其相似。

关注

2
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
[DataAnalysis]定序回归模型OLM深入浅出

一、为什么使用定序回归：定序变量介于连续变量和定类变量之间，是在测量层次上被分为相对次序的不同类别，但并不连续。如果对定序变量使用多分类logit模型（MNL），那么会无视数据内在的排序从而导致排序信息的缺失，使得统计结果因为遗漏掉排序信息而丧失统计效率。如果采用OLS，那么就是将定序变量作为连续变量处理，会导致人为的信息膨胀。因此，针对定序因变量，需采用对...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。