## 基于多元统计方法对高中阶段学生构成分析研究

基于多元统计方法对高中阶段学生构成分析研究

摘要
为了了解我国各高中阶段学生人数的构成状况,基于我国各高中2010年至2020年各高中学生数据,应用多元统计分析进行统计分析研究。
关键词:主成分分析;层次聚类分析;高中学生数
代码如下(示例):

date=c(2010,2011,2012,2013,2014,2015,2016,2017,2018,2019,2020)
total=c(4676.2,4685.6,4594.3,4370,4170.7,4037.8,3970.1,3971.3,3934.6,3994.8,4163)
A=c(2427.3,2454.8,2467.2,2435.9,2400.5,2374.4,2366.6,2374.6,2375.4,2414.3,2494.5)####普通高中
B=c(11.5,26.5,14.4,11.1,14.9,6.6,4.4,3.9,4,4.1,5.2)###成人高中
C=c(877.7,855.2,812.6,772.2,749.1,732.7,718.1,713,699.4,703.6,735.4)###普通中专
D=c(212.4,238.7,254.3,230,194.4,162.7,141.2,127.2,113.1,106.8,112.7)####成人中专
E=c(726.3,681,623,534.2,472.8,439.9,416.6,414.4,401.1,405.7,419.7)####职业高中
F=c(421,429.4,422.8,386.6,339,321.5,323.2,338.2,341.6,360.3,395.5)####技工学校
G=c(2248.9,2230.8,2127.1,1934.1,1770.2,1663.4,1603.5,1596.7,1559.2,1580.5,1668.5)#####中等职业教育总人数
totle=c(4676.2,4685.6,4594.3,4370,4170.7,4037.8,3970.1,3971.3,3934.6,3994.8,4163)#####从2010年到2020年各高中学生总人数
######数据框################
data=data.frame(date,total,A,B,C,D,E,F)
######折线图################
plot(date,A,type="b",pch=1,lty=1,col="red",xlim=c(2010,2020),ylim=c(0,2500),
main="高中阶段学生数的构成",xlab="时间",ylab="学生数量(万人)")
lines(date,B,type="b",pch=2,lty=2,col="blue")
lines(date,C,type="b",pch=3,lty=3,col="orange")
lines(date,D,type="b",pch=4,lty=4,col="green")
lines(date,E,type="b",pch=5,lty=5,col="black")
lines(date,F,type="b",pch=6,lty=6,col="purple")
legend("topleft",inset=.05,title="type",legend=c("A","B","C","D","E","F"),
pch=1:6,lty=1:6,col=c("red","blue","orange","green","black","purple"))
abline(h=1000)
#######扇形图################
library(plotrix)
totle=c(4676.2,4685.6,4594.3,4370,4170.7,4037.8,3970.1,3971.3,3934.6,3994.8,4163)
time=c("2010年","2011年","2012年","2013年","2014年","2015年","2016年","2017年","2018年","2019年","2020年")
fan.plot(totle,labels=time,main="学生总人数变化")
#####主成分分析(1)#############################
x=data.frame(date,A,B,C,D,E,F)###数据导入  
date=x$date##########数据对数化
lnA=log(x$A)
lnB=log(x$B)
lnC=log(x$C)
lnD=log(x$D)
lnE=log(x$E)
lnF=log(x$F)
lnx=cbind(lnA,lnB,lnC,lnD,lnE,lnF)
lnx
cor(lnx)########求出lnx的相关系数矩阵
ev=eigen(cor(lnx))
ev########求相关系数矩阵的特征值及特征向量
##############根据累计贡献率确定主成分
###########主成分分析方法(2)############################
x1=data.frame(A,B,C,D,E,F)
eco_x1=princomp(x1,cor=T)
summary(eco_x1,loading=T)
################碎石图###################################
screeplot(eco_x1,type="l")
abline(1,0,col="blue")
###############因子载荷阵################
eco_x1$loadings[,1:2]
#############关于主成分的散点图和原坐标在主成分下的方向#################
biplot(eco_x1)
############################################################
x1=data.frame(A,B,C,D,E,F)
Z=princomp(x1,cor=T)
summary(Z)
Z$loadings
screeplot(Z,type="lines")
pc=Z$scores;pc
pc[,2]=pc[,2]
pc1=rank(-pc[,1]);pc1
##############################################################
###################层次聚类分析####################
data=data.frame(date,total,A,B,C,D,E,F)
head(data)
h1=hclust(dist(scale(data[,-1])),method="ward.D2")
plot(h1,labels=data[,1],cex=.6,main=("Method:ward.D2"),xlab="")

总结

本文以2010年到2020年我国各高中学生人数数量为数据,利用主成分分析法和层次聚类法,对11年来各高中学生人数构成进行分析分类。

  • 13
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值