儿童数学能力和什么有关
1 文章介绍及背景
1.1 数据获取
- 本次录屏的视频点击此处获取。
- 本次录屏的数据来自《Psychological Science》的2017年11月的一篇文章,Early Conceptual Understanding of Cardinality Predicts Superior School-Entry Number-System Knowledge(点击获取文章),作者是来自密苏里大学的David C. Geary教授的团队(课题组网站),团队在OSF网站中公开了研究材料和研究数据(点击获取数据)。
1.2 论文内容
- 研究目的
主要探究学龄前儿童的数量能力(quantitative competencies)和他们入学时对数学系统知识(number-system knowledge,简称NSK)的认识之间的联系。 - 研究内容
研究在学前开始和未来2年的学前阶段进行了评估141名儿童(69名男孩)对基数概念(cardinal value)的理解,同时测量他们在幼儿园结束时的数学和阅读成绩以及在一年级开始时的NSK。 - 结论
研究结合贝叶斯分析和标准回归显示,在控制执行功能、智力和父母的教育水平之后,孩子们知道基数概念(cardinal value)的早晚能够预测他们后来NSK的水平。 - 意义
不只是基数原则的知识,而是对这一原则的掌握年龄对后来数学发展有着重要作用,结果为学校教育等提供了理论支持。
2 数据介绍
2.1 数据导入
- 在R中导入开放数据中的txt文件,加上变量名,命名为GearyData。
GearyData=read.table("D:/Literature/Archive.txt", na.strings = ".", header=F)
colnames(GearyData)=c('ID', 'edcon', 'nviq', 'viq', 'y1ef', 'y2ef', 'Pals', 'y2temascore', 'CPMK', 'WRK', 'NOK',
'y1gnt1', 'gngain', 'cpk', 'y1nrt1', 'nrgain', 'y1vct1', 'vcgain', 'y1dqdacct1', 'ansgain', 'y1ocscoreT1', 'ocsgain',
'number', 'age1', 'age2', 'age3', 'age4', 'age7', 'age9', 'age10', 'age11', 'age12', 'age14', 'age16')
- 为了方便之后的操作,在R中导出csv格式的数据文件。
write.csv(GearyData,file="D:/GearyData.csv",quote=F,row.names = T)
2.2 变量介绍
本部分只介绍本录屏中使用到的变量,其他变量可参见数据文件中的R文件。
变量 | 对应名称 |
---|---|
父母教育水平 | edcon |
学龄前第一、二年的执行控制能力 | y1ef、y2ef |
学龄前第一年的语言智力 | viq |
学龄前第一年的非语言智力 | nviq |
掌握基数原则的时间 | cpk |
一年级开始的NSK知识 | number |
- 其中cpk(cardinal principle knower)指该儿童知道cp的时间,共有1-5五个水平,在模型中采用第5组作为参照组:
- 1:第一次测量成为cpk
- 2:第二次测量成为cpk
- 3:第三次测量成为cpk
- 4:第四次测量,即学前结束的测量成为cpk
- 5:在学前结束也未掌握cp
attach(GearyData)
cpk[which(cpk==5)] <-0
str(GearyData)
cpk<-as.factor(cpk)
summary(cpk)
3 模型建立
采用cpk预测NSK。
3.1 模型
- 因变量:number
- 自变量:
- SET1:edcon、nviq、viq、y1ef、y2ef
- SET2:cpk
3.2 R语言中的回归诊断
先将cpk转为factor,建立模型后,得出四幅残差诊断图,该部分的解释可参考《R语言实战》回归一章的内容。
attach(GearyData)
fit<-lm(number~ncpk+edcon+nviq+viq+y1ef+y2ef)
summary(fit)
par(mfrow=c(2,2))
plot(fit)
3.2.1 回归分析结果
回归诊断图示
- 左上:残差和预测值有无系统关联,及因变量和自变量是否线性相关;
- 右上:残差是否为正态分布,落在45度线上说明满足正态分布假设;
- 左下:是否满足方差齐性假设,水平线周围的点是否随机分布;
- 右下:鉴别离群点、高杠杆值和强影响点。
采用car包中的influencePlot函数可以补充右下这张图。
library(car)
influencePlot(fit)
3.3 SPSS回归嵌套模型
- 在控制父母受教育水平、儿童的执行控制能力和智商等因素后,基数原则的掌握时间和上学前数学能力的关系,因此SET1的变量先进入模型,SET2的变量后进入模型。
- 在SPPS中导入csv文件,首先建立哑变量,以第5组为参照组,然后建立嵌套回归模型。
RECODE cpk (