ridit检验

knitr::opts_chunk$set(tidy = TRUE, warning = FALSE,message = FALSE)

setwd("C:\\Users\\213yi\\Desktop\\非参数统计\\5-7")
library(showtext) #载入库
library(datarium)
library(xlsx)
library(vcd)
library(foreign)

案例一

数据观察

camera<-read.spss("camera-chisq2.sav")
attach(camera)
#table()函数outlook和function函数可以汇总为二维列联表
ridit_outlook=rbind(table(c01),table(c02),table(c03),table(c04),table(c05))
print(ridit_outlook)
  • 上述的列联表包含5个可测变量,从c01到c05分别表示携带方便、新潮、颜色多样、搭配流行图案、操作简单,这5个方面重视程度的有序分类变量

  • 重视程度从1-5分别增加,从非常不重视到非常重视

#table()函数外观和功能变量可以汇总为二维列联表
ridit_fun=rbind(table(c11),table(c12),table(c13),table(c14),table(c15),table(c16))
print(ridit_fun)
  • 上述的列联表包含6个可测变量,从c11到c16分别表示拍摄、定时、转换、上网等6个方面重视程度的有序分类变量

  • 重视程度从1-5分别增加,从非常不重视到非常重视

ridit函数

ridit.test<-function(x,method="total"){
    #x是传入的列联表
  order.num=ncol(x)
  treat.num=nrow(x)
  row.sum=rowSums(x)#分行求和
  col.sum=colSums(x)#分列求和
  total=sum(row.sum)#总样本量
  N=(col.sum/2)[1:order.num]+c(0,cumsum(col.sum)[1:(order.num-1)])#计算出Nj
  ##哇 我哭啦,1小时的时间花费在究竟是c(0,cumsum(col.sum)[1:(order.num-1)])
  #还是c(0,cumsum(col.sum))[1:(order.num-1)]

  ri=N/total#计算出每个顺序的得分
  p_coni=x/outer(row.sum,rep(1,order.num),'*')#概率阵
  pi=row.sum/total#第i水平的概率
  score=p_coni %*% ri#每个水平的得分
  confi_inter=matrix(c(score-1/sqrt(3*row.sum),score+1/sqrt(3*row.sum)),byrow=FALSE,ncol=2)
  w=12*sum(row.sum*(score-0.5)^2)
  pvalue=pchisq(w,df=treat.num-1,lower.tail = FALSE)
  list(ri=ri,score=score,confi_inter=confi_inter,W=w,Pvalue=pvalue)
}

置信区间可视化

res_outlook=ridit.test(ridit_outlook)
print(res_outlook)
graph_outlook=res_outlook$confi_inter
plot(0,0,ylim=c(0,1),xlim=c(1,5),xlab="",ylab="",main="Ridit value confidence interval (outlook)",col="gray7",xaxt="n")
abline(h=0.5,col="blue")
for (i in 1:nrow(graph_outlook)) lines(c(i,i),graph_outlook[i,],lwd=2)
axis(1,at=c(1,2,3,4,5),labels = c("c01","c02","c03","c04","c05"))

res_fun=ridit.test(ridit_fun)
graph_fun=res_fun$confi_inter
plot(0,0,ylim=c(0,1),xlim=c(1,6),xlab="",ylab="",main="Ridit value confidence interval (function)",col="gray7",xaxt="n")
abline(h=0.5,col="blue")
for (i in 1:nrow(graph_fun)) lines(c(i,i),graph_fun[i,],lwd=2)
axis(1,at=c(1,2,3,4,5,6),labels = c("c11","c12","c13","c14","c15","c16"))
print(res_fun)

输出结果:

  • score是水平变量的得分

  • ri是各种顺序变量的得分

  • confi_inter是置信区间

  • w是对于所有的水平,一起看,重视度是否有差异

  • 整体的思路是:先确定1个标准组作为特定总体,根据分布概率求出 R i R_i Ri,作为顺序变量的得分。接着,对于每个水平处理变量,根据在不同顺序的占比作为权重,计算得分。

检验结果:

  • 两个检验p值分别为7.065453e-79,1.044784e-108说明拒绝原假设,通过检验

  • 说明分类可测变量(外观、功能)的满意度差异是显著的

从置信区间可以看出:

1.对于外观而言,c01、c03、c04在0.5的下方,说明重视程度与0.5的参照组相比较低,c02和c05在0.5横线的上方,其置信区间高于参照组,因此顾客对其重视程度高于平均水平,商家应当值得关注,以后大力关注并改进

2.对于功能而言,可以看到c14、c15、c16变量完全在中横线下方,说明客户对这三个变量的重视程度较低,c13变量与中横线略有交叠,大部分在横线下方,说明客户对这个变量的重视程度比参照组略低.表现较好的是 c11(连动拍摄)和 c12(多角度拍摄)变量

结论:

  • 非专业人士选购数码相机时,重视2方面∶

1.相机的外观.新潮的相机外观设计c02和简单的操作c05是吸引非专业人士的两大特点;相比之下,相机颜色、方便携带以及流行图案并不是影响相机购买的主要外观因素

2.相机的功能.连动拍摄c11和多角度拍摄c12是更看着的功能;相比之下,而可接三脚架、可更换镜头、上网这样的功能一般并不是人们选购的主要标准,人们并不在意这些功能

案例二

基础功能

data=read.xlsx("图片2.xlsx",sheetName ='Sheet1')
data=as.matrix(data[1:7,-1])
data=as.table(data)
result=ridit.test(data)
graph_res=result$confi_inter
plot(0,0,ylim=c(0,1),xlim=c(1,7),xlab="",ylab="",main="共享单车品牌重视因素的置信区间",col="gray7",xaxt="n")
abline(h=0.5,col="blue")
for (i in 1:nrow(graph_res)) lines(c(i,i),graph_res[i,],lwd=2)
axis(1,at=1:7,labels = c("外观","解锁","骑行舒适","是否押金","押金价格","退还","收费标准"))
print(result)

附加功能

data=read.xlsx("图片2.xlsx",sheetName ='Sheet1')
data=as.matrix(data[8:14,-1])
data=as.table(data)
result=ridit.test(data)
graph_res=result$confi_inter
plot(0,0,ylim=c(0,1),xlim=c(1,7),xlab="",ylab="",main="共享单车品牌重视因素的置信区间",col="gray7",xaxt="n")
abline(h=0.5,col="blue")
for (i in 1:nrow(graph_res)) lines(c(i,i),graph_res[i,],lwd=2)
axis(1,at=1:7,labels = c("电动","定位","临时锁车","预约","围栏","太阳充电","App"))
print(result)
  • 本题是共享单车品牌选择的影响因素

  • 对于基础指标的重视程度是否存在差异:观察w值,并于卡方分布作为比较,其 p . v a l u e = 1.125178 e − 68 < 0.05 p.value=1.125178e-68<0.05 p.value=1.125178e68<0.05,说明在显著性水平5%,人们对共享单车的各项基础指标重视度不同

  • 接着看置信区间:人们对于骑行舒适更加看重,十分重视

  • 对于附加指标的重视程度是否存在差异:观察w值,并于卡方分布作为比较,其 p . v a l u e = 3.062546 e − 47 < 0.05 p.value=3.062546e-47<0.05 p.value=3.062546e47<0.05,说明在显著性水平5%,人们对共享单车的各项附加指标重视度不同

  • 接着看置信区间:人们对于定位、临时锁车、需要App更加看重,十分重视

5.11

data<-matrix(c(90, 23, 53, 21, 13,
               47, 34, 28, 18, 5,
               20, 13, 10, 5, 2,
               28, 32, 33, 45, 16,
               34, 28, 52, 40, 10),
             nrow = 5, ncol = 5, byrow = TRUE)
datatable=as.table(data)
res=ridit.test(datatable)
graph_res=res$confi_inter
plot(0,0,ylim=c(0,1),xlim=c(1,5),xlab="",ylab="",main="手机各项指标满意度的置信区间",col="gray7",xaxt="n")
abline(h=0.5,col="blue")
for (i in 1:nrow(graph_res)) lines(c(i,i),graph_res[i,],lwd=2)
axis(1,at=c(1,2,3,4,5),labels = c("信号","外型","维修","功能","操作"))
print(res)
  • 本题是某电信公司调查某手机的售后产品及服务满意度

  • 对于各种指标的满意度是否存在差异:观察w值,并于卡方分布作为比较,其 p . v a l u e = 7.04031 e − 09 < 0.05 p.value=7.04031e-09<0.05 p.value=7.04031e09<0.05,说明在显著性水平5%,人们对手机的各项指标满意度不同

  • 接着看置信区间,可以看出人们对功能、操作的满意度较高,(从不满意到满意的得分是递增的,得分越高、越满意);人们对信号、外形、维修的满意度较低,尤其是维修,方差较大,且下0.25分位点最低,值得商家后续关注提升。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值