本博客是线性回归的入门案例,仅用到一阶线性回归
代码中用到的数据集下载地址
[link] https://pan.baidu.com/s/12wSIOVMQ3zS3jK0FcwkTSw[
python3版本代码段
导包
#导包
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import time
import sklearn
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_absolute_error,r2_score
加载数据,过滤残缺数据
# 加载数据
path = '../data_files/household_power_consumption_1000.txt' ## 1000行数据
df = pd.read_csv(path, sep=';', low_memory=False) #当文件中的数据类型为单一类型时,low_memory能提高效率
# 异常数据处理(异常数据过滤)
new_df = df.replace('?', np.<