line model lm
1、残差:估计量和观测值Y的差
2、最小二乘法
是一种求最优解的数学优化技术
离差平方和(TSS)最小=》离差平方和 对回归参数求偏导得出回归参数值
3、拟合优度:
TSS (离差平方和)= ESS (回归平方和)+ RSS(残差平方和)
回归平方和:与
的差和
残差平方和:Y与的查和
可决系数 = ESS/TSS(回归平方和在总离差中的比例,越大拟合优度越高),
=1 完全拟合,
=0无线性关系
每个系数的t检验
整体的f检验
4、python使用方法
from sklearn.linear_model import LinearRegression
x = data[['balance','interval']]
y = data['sign']
'''拆分训练数据与测试数据 '''
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.2)
linerg = LinearRegression()
model = linerg.fit(x_train,y_train)
print linerg.intercept_
print linerg.coef_
'''预测'''
y_pre = linerg.predict(x_test)