昨天更新到了fraud v2(使用mysql),然后用剩下的时间做了一个分析,关于上浮下调对于逾期的影响,逾期按照了领导的定义,上浮下调分成了3组,对于其中应该温习的知识点归纳一下
1、spss对于rc表做卡方检验,可以把excel的数据直接导入到spss中,用表头做列明,然后直接用交叉表中的分析,这种方法应该是最简便的,还有种方法就是自己去统计每一种可能的数量,对于后者要麻烦一点儿,有个个案加权的操作,参考http://jkzx.zggs.gov.cn/n2358c89.aspx
2、对于rc表,如果有cell中的个数小于5,要注意一下,卡方检验有一个应用条件,
RC表,理论数小于5的格子数不能超过1/5
不能有小于1的理论数
符合这两个条件,才能应用RC表的卡方检验
3、比如RC表是一个2*3的,行列互换变为3*2的,检验结果是不会变的,但是在解释上是不同的,一个是三者之间的关系,一个是二者之间的关系,具体到我这个case,三者的H0是上浮下调不变的逾期率是相等的,而H1是三者不全相等,我有一个更进一步的问题就是说三者如果不全相等,可否把两两进行卡方检验,找出相等的和不等的?
4、对于3的解答,我已经在互联网上搜到了相关的解决方案,可以拆开两两进行卡方检验,但是要调整检验水平,比较次数,Ck2=k(k-1)/2,0.05/比较次数,等于新的检验水平,实际应用中有可能会遇到悖论的情况,具体可参考以下:
http://www.dxy.cn/bbs/thread/30827185#30827185
http://www.dxy.cn/bbs/thread/22933943#22933943