独立同分布independent and identically distributed (i.i.d.)
1.1回归分析导论
在做实验的时候呢,因为女人比男人一般而言要short,于是呢修正了,即把女人的身高*1.08
老师首先要谈的是marginal,即上面的两张图
那个符号叫mu
那么manipuate:即创建一个动态的图
图呢是一个带有图标的动态图
这种不从线性代数的角度来直接推论,倒还真是。。。确实不同于线性回归的一般公式
好像在统计学中并非是Yi-u,而是Y实际-Y预测
也就是此处的u是为重心,而得出结论为可用Y的均值替代的意思
myPlot <- function(beta){
y <- galton$child - mean(galton$child)
x <- galton$parent - mean(galton$parent)
freqData <- as.data.frame(table(x, y))
names(freqData) <- c("child", "parent", "freq")
plot(
as.numeric(as.vector(freqData$parent)),
as.numeric(as.vector(freqData$child)),
pch = 21, col = "black", bg = "lightblue",
cex = .15 * freqData$freq,
xlab = "parent",
ylab = "child"
)
abline(0, beta, lwd = 3)
points(0, 0, cex = 2, pch = 19)
mse <- mean( (y - beta * x)^2 )
title(paste("beta = ", beta, "mse = ", round(mse, 3)))
}
manipulate(myPlot(beta), beta = slider(0.6, 1.2, step = 0.02))
最终出现汽泡图也是因为这一步,真是开眼了哈
cex = .15 * freqData$freq
然后解决办法也是这样的
lm(I(child - mean(child))~ I(parent - mean(parent)) - 1, data = galton)
此处-1表示不要截距,
Call:
lm(formula = I(child - mean(child)) ~ I(parent - mean(parent)) -
1, data = galton)
Coefficients:
I(parent - mean(parent))
0.6463
1.2一些小点
empirical mean经验均值
此处看来可以跟上节的联系于一起了呀,因为Xi-X的均值,它们之和是为0的,所以开始求平方和了
1.3线性最小二乘法
recap what we know 即回顾我们所学
1.4 回归于均值
反正就是人生在世,一靠能力,二靠运气。两者都重要