使用sklearn 自带的波士顿房价数据集,对样本数据进行分析。波士顿房价数据集(boston)包含506组数据,每条数据包含房屋以及房屋周围的详细信息。其中包含城镇犯罪率、一氧化氮浓度、住宅平均房间数、到中心区域的加权距离以及自住房平均房价等。该实验要依据房屋的属性信息,对房屋的价格进行预测。
# -*- coding: utf-8 -*-
"""
Created on Fri Sep 20 11:12:07 2024
@author: dell
"""
from sklearn.datasets import fetch_openml
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
import numpy as np
# 加载波士顿房价数据集
#由于波士顿房价数据集在较新版本的 sklearn 中已被弃用,这里使用了 fetch_openml 来加载一个类似的数据集。如果需要使用原始的波士顿房价数据集,你可能需要从其他来源下载数据或使用旧版本的 sklearn。
boston = fetch_openml(name='boston', version=1, as_frame=True)
X, y = boston.data, boston.target
# 查看数据集前几行以确认数据加载正确
print(X.head())
print(y.head())