大家好!欢迎关注小号:医学统计数据分析,今天我们来介绍一下医学统计学中常用统计学方法的R语言基本操作。
R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
我们先下载R与Rstudio的安装包,先安装R,再安装Rstudio。RStudio是一款R语言的集成开发环境(IDE),R自带的环境操作起来可能不是方便,而Rstudio很好地解决了这个问题,RStudio只是辅助你使用R进行编辑的工具,因为它自身并不附带R程序。
R下载地址(官网):
https://cran.r-project.org/bin/windows/base/
Rstudio(官网):
https://rstudio.com/
打开RStudio之后,会出现上图所示的窗口,其中有四个独立的面板。RStudio界面分为左上角的源码编辑、脚本显示,左下角的代码执行、控制台,右上角的代码历史记录、数据对象列表,右下角的代码组织管理、包安装、更新、绘图。
一、R导入Excel数据
我们先把需要分析的Excel表格另存为.csv格式,使用
数据读取后,在脚本显示窗口可见数据预览:
使用summary()语句,对导入的数据大致分布做一下基本了解:
二、单因素(方差分析与卡方检验)
使用 anova
summary(anova) 语句,可得方差分析结果:DF/SS/MS/F值/P值
使用plot(分组因素,研究因素)语句,可画出三组比较的箱形图:
使用chisq.test(分组因素,研究因素)做卡方检验,可见下图输出:
三、相关与回归
使用cor.test(testdata$1,testdata$2)语句做相关性分析,使用plot(因素1,因素2)语句画出散点图。
使用> lm(Y~X+1)语句及> summary(lm(Y~X+1))语句得到一元线性回归的B值、R2、残差分析等结果。
四、时间序列图等
根据整理好的时间序列资料,使用plot()语句,即可直接画出时间序列图(散点):
安装包:
install.packages("zoo")
install.packages("xts")
载入包:
library(zoo)
library(xts)
计算与画图:
ts
plot(ts)
xts可画出线图:
同样,我们也可以画出五日平均线等平滑曲线:
欢迎关注小号:医学统计数据分析,您的支持是我们进步最大的动力!