【多元统计分析与R语言建模】【详解】【附代码文档及数据】使用1. 教材P291页表格10-4,将由1660个人组成的样本按心里健康状况和社会经济状况进行交叉分组,对这组数据进行对应分析,解释结果

通过对1660个人的样本数据进行交叉分组和对应分析,揭示了心理健康状况与社会经济状况之间的正相关性。在广东省2018年的专利申请情况中,对应分析显示专利类型(发明、实用新型、外观设计)与地区分布有显著关联,一线城市如深圳和广州在发明专利上更为突出。
摘要由CSDN通过智能技术生成

1.题目

  1. 教材P291页表格10-4,将由1660个人组成的样本按心里健康状况和社会经济状况进行交叉分组,分组结果如表所示,对这组数据进行对应分析,解释结果。
  2. 附件“广东省2018年专利申请情况”,该表格反映了专利授权的统计情况,进行对应分析,并且解释原因(参照例题10.1和10.2)。
  3. 代码、文档及数据链接在最底部

2.题目详解

2.1 教材P291页表格10-4,将由1660个人组成的样本按心里健康状况和社会经济状况进行交叉分组,分组结果如表所示,对这组数据进行对应分析,解释结果。

对数据进行卡方检验:

library(xlsx)
data = read.xlsx("C:\\Users\\6\\Desktop\\R语言\\实验5\\心理健康状况与社会经济状况数据.xlsx",'Sheet1',row.names=T)
chisq.test(data)

运行结果:
在这里插入图片描述

分析:由于X²值等于45.594,P<0.001,所以拒绝原假设H0,接受H1,认为因素A与因素B不独立,即心理健康状况与社会经济状况之间有密切关系,可以进一步做对应分析。
对数据进行对应分析:

# install.packages("ca")
library(ca)
ca1 = ca(data)
summary(ca1)

运行结果:
在这里插入图片描述
查看行坐标及列坐标:

ca1$rowcoord
ca1$colcoord

运行结果:
在这里插入图片描述

分析:前两个特征对总方差的贡献率分别为94.7%与5%,反映的便是维度一与维度二对总信息的贡献。前两个因子的贡献率已达到了99.8%,说明前两个主因子已经代表了绝大多数信息了,于是确定主因子个数为2,用前两个特征值相应的因子载荷向量绘图。

plot(ca1)

在这里插入图片描述

分析:
根据上图可以将样本点与变量分为三组:
第一组:父母社会经济状况高
样本:心理健康状况好
第二组:父母社会经济状况中高与中
样本:心理健康状况轻微症状、中等症状
第三组:父母社会经济状况中低与低
样本:心理健康状况受损

在这些分类中很容易看出,父母社会经济情况与心理健康状况称正相关,高的收入对应着好的心理状况,低的收入对应着受损的心理状况。这点可以这样解释:父母社会经济收入高的孩子,在家中基本上无忧无虑,衣食无忧,同时能够接触到更多的爱好以及娱乐项目,能够开拓视野,在这样的环境下心理状况自然会好一些。而父母社会经济情况低的孩子,则可能面临着食不果腹以及无法读书的情况,每天担心着家里的支出,这样的孩子每天都在焦虑中生活,心理状况很难不受损。

2.2 附件“广东省2018年专利申请情况”,该表格反映了专利授权的统计情况,进行对应分析,并且解释原因(参照例题10.1和10.2)。

对数据进行卡方检验:

data1 = read.xlsx("C:\\Users\\6\\Desktop\\R语言\\实验5\\广东2018年专利申请情况.xlsx",'Sheet1',row.names=T)
chisq.test(data1)

运行结果:
在这里插入图片描述

分析:由于X²值等于65534,P<0.001,所以拒绝原假设H0,接受H1,认为因素A与因素B不独立,即专利的类型与地区之间有密切关系,可以进一步做对应分析。

对数据进行对应分析:

# install.packages("ca")
ca2 = ca(data1)
summary(ca2)

运行结果:
在这里插入图片描述
在这里插入图片描述
查看行坐标及列坐标:

ca2$rowcoord
ca2$colcoord

运行结果:
在这里插入图片描述
在这里插入图片描述

分析:前两个特征对总方差的贡献率分别为87.7%与12.3%,反映的便是维度一与维度二对总信息的贡献。前两个因子的贡献率已达到了100%,说明前两个主因子已经代表了绝大多数信息了,于是确定主因子个数为2,用前两个特征值相应的因子载荷向量绘图。

plot(ca2)

在这里插入图片描述

分析:根据上图可以将样本点与变量分为三组:
第一组:外观设计
样本:潮州、揭阳、汕头、阳江、中山、茂名、韶关
第二组:实用新型
样本:湛江、梅州、云浮、汕尾、江门、惠州、东莞、清远、河源、肇庆、广州
第三组:发明
样本:深圳、佛山、珠海

结合数据及上图的分类结果可以看出,深圳,广州这两个一线城市是获得专利最多的城市,在分类上深圳更偏向于发明而广州偏向于实用新型,这是由于专利申请难度所导致的。广州是众多央企、高等院校、大型企业的总部所在地;而深圳则拥有众多高科技企业以及顶尖的经济实力,相比之下,对于学生来说实用新型则比发明专利更好申请且申请时间短,因此广州偏向实用新型。深圳众多的高科技企业则更倾向于申请发明专利。
佛山与珠海两地也更倾向于发明专利,虽然这两地远不及深圳有众多的高新企业,但是也不乏高技术企业如美的集团,博智林机器人,季华实验室等,对比其他地区的发明专利数量,把他们归为发明专利一类也是合理的。
东莞、肇庆、清远等地归为实用新型专利,这些城市中都是近几年的新一线及二线城市,在发明专利上面远不如珠海佛山等地强大,因此归为实用新型专利。
在中山、茂名等地有著名的国际灯博会等,在这方面外观设计的专利申请的就会比较多,外观专利在所有专利中的占比较大,因此将中山等地归类为外观专利。

3.链接

链接:https://pan.baidu.com/s/1WvvnLAes9DrGqJl7yiuQOA
提取码:8888

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值