今天家里有点突然的变化,以后人生也会有变化了。心情突然很复杂。。。五味杂陈。每次遇到重大变故我都会很呆。反应不过来的样子。。。
继续数据分析
两组数之间看关系,两种情况,一种是函数关系,另外一种呢就是相关分析。
相关分析,我们可以用散点图。直觉指导一切。函数关系呢,比较难,今天挑战的是函数关系
回归分析。
首先我先将两组数据导入一个data.frame中,画出散点图。发现确实还蛮正相关的。
cor(GMV$GMV,GMV$fusers)
[1] 0.918901
相关系数达到0.92
然后又做了一个假设性检验
with(GMV,{cor.test(GMV,fusers)})
Pearson's product-moment correlation
data: GMV and fusers
t = 84.276, df = 1309, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.9100346 0.9269271
sample estimates:
cor
0.918901
p-value 远小于0.05,不错哦,确实正相关。
再然后我做了一个简单的线性回归
fit<-lm(GMV~fusers,data=GMvr)
> summary(fit)
Call:
lm(formula = GMV ~ fusers, data = GMvr)
Residuals:
Min 1Q Median 3Q Max
-1.278e+09 -6.822e+07 -1.189e+07 3.787e+07 1.296e+09
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.491e+07 9.126e+06 6.016 2.32e-09 ***
fusers 2.899e+03 3.634e+01 79.775 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 172300000 on 1305 degrees of freedom
Multiple R-squared: 0.8298,
Adjusted R-squared: 0.8297
F-statistic: 6364 on 1 and 1305 DF, p-value: < 2.2e-16
with(GMvr,{plot(GMV,fusers,xlab="***",ylab="***")})
abline(fit)
然后图形就令我匪夷所思了
简直就没有贴合上么。。。失败了。。这些参数还没研究透是干什么的,感冒到现在还没好,一个月了,准备乖乖睡觉了。明天继续。