模型评价:回归模型的常用评价指标
1) 样本误差:衡量模型在一个样本上的预测准确性
样本误差 = 样本预测值 - 样本实际值
2) 最常用的评价指标:均误差方(MSE)
指标解释:所有样本的样本误差的平方的均值
指标解读:均误差方越接近0,模型越准确
3) 较为好解释的评价指标:平均绝对误差(MAE)
指标解释:所有样本的样本误差的绝对值的均值
指标解读:平均绝对误差的单位与因变量单位一致,越接近0,模型越准确
4)平均绝对误差的衍生指标:平均绝对比例误差(MAPE)
指标解释:所有样本的样本误差的绝对值占实际值的比值
指标解读:指标越接近与0,模型越准确
5)模型解释度:R squared R方 r2
指标解释:应变量的方差能被自变量解释的程度
指标解读:指标越接近1,则代表自变量对于应变量的解释度越高
使用sklearn查看回归模型的各项指标
1) 加载数据
import pandas as pd
import matplotlib.pyplot as plt
import os
os.chdir(r'C:\Users\86177\Desktop')
# 样例数据读取
df = pd.read_excel('realestate_sample_preprocessed.xlsx')
# 根据共线性矩阵,保留与房价相关性最高的日间人口,将夜间人口和20-