泻药,可以参考下例子:
R语言逐步多元回归模型分析长鼻鱼密度影响因素
原文链接:http://tecdat.cn/?p=9564tecdat.cn
目录
我从马里兰州生物流调查中提取了一些数据,以进行多元回归分析。数据因变量是每75米长的水流中长鼻鱼(Rhinichthys cataractae)的数量。自变量是河流流失的面积(英亩);氧(毫克/升);水流段的最大深度(以厘米为单位);硝酸盐浓度(毫克/升);硫酸盐浓度(毫克/升);以及采样日期的水温(以摄氏度为单位)。
如何做多元回归
多重相关
数据集包含多个数字变量时,最好查看这些变量之间的相关性。原因之一是,可以轻松查看哪些自变量与该因变量相关。第二个原因是,如果要构建多元回归模型,则添加高度相关的自变量不太可能对模型有很大的改进。
最后,值得看一下数字变量的分布。如果分布差异很大,则使用Kendall或Spearman相关性可能更合适。同样,如果自变量与因变量的分布不同,则可能需要对自变量进行转换。
Data = read.table(textConnection(Input),header=TRUE) library(dplyr) Data.num = select(Data, Longnose, Acerage, DO2, Maxdepth, NO3, SO4, Temp) library(FSA) headtail(Data.num) Longnose Acerage DO2 Maxdepth NO3 SO4 Temp 1 13 2528 9.6 80 2.28 16.75 15.3 2 12 3333 8.5 83 5.34 7.74 19.4 3 54 19611 8.3 96 0.99 10.92 19.5 66 20 4106 10.0 96 2.62 5.45 15.4 67 38 10274 9.3 90 5.45 24.76 15.0 68 19 510 6.7 82 5.25 14.19 26.5 library(psych) corr.test(Data.num, use = "pairwise", method="pearson", adjust="none", # Can adjust p-values; see ?p.adjust for options alpha=.05) Correlation matrix Longnose Acerage DO2 Maxdepth NO3 SO4 Temp Longnose 1.00 0.35 0.14 0.30 0.31 -0.0