sklearn加载波士顿数据集

此数据集原本应该在 sklearn 中是自带数据集之一,但在 scikit-learn 1.2 版本由于某些特殊原因被移除,所以无法使用 load_boston() 获取。我们可以使用fetch_openml()方法,从openml.org存储库中读取数据集。

from sklearn.datasets import fetch_openml

data_x, data_y = fetch_openml(name="boston", version=1, as_frame=True, return_X_y=True, parser="pandas")

name:数据集在 openml.org 上的名称

version:版本号,根据 openml.org 上的描述,使用 1 版本是原始数据集,所以我选择 1 版本,具体根据对应数据集的描述选择

as_frame=True 表示返回 pandas 的 DataFrame 格式,这样可以直接使用 pandas 的方法进行数据处理

return_X_y:表示分别返回特征和标签,如果为 False 则返回一个字典【包含特征和标签】,如果你想要的是字典格式,可以设置为 False,而且默认也是 False
parser 表示用于加载 ARFF 文件的解析器,默认的是 liac-arff
● liac-arff:使用 liac-arff 库解析 ARFF 文件,ARFF 是一种用于存储数据集的格式,它支持缺失值和注释,但是速度较慢
● pandas:使用 pandas 库解析 ARFF 文件,ARFF 是一种用于存储数据集的格式,它支持缺失值和注释,但是速度较慢
● auto:自动选择解析器,如果 ARFF 文件的格式不支持 liac-arff,则使用 pandas 解析,否则使用 liac-arff
更复杂的参考官方文档:sklearn.datasets.fetch_openml — scikit-learn 1.3.0 documentation

  • 9
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
sklearn中的波士顿数据集是一个经典的回归问题数据集,用于预测波士顿地区房屋价格的中位数。该数据集包含了506个样本和13个特征,其中包括城镇犯罪率、住宅平均房间数、到中心区域的加权距离等。\[1\]你可以使用sklearn中的load_boston函数来加载数据集,并将数据集分为输入特征X和输出标签y。\[1\]你还可以使用train_test_split函数将数据集划分为训练集和测试集,然后使用LinearRegression函数进行线性回归模型的训练和预测。\[2\]训练完成后,你可以使用score函数查看模型在测试集上的准确率,使用coef_属性查看每个特征对应的系数。\[3\] #### 引用[.reference_title] - *1* [使用sklearn加载波士顿房价数据集](https://blog.csdn.net/weixin_44385745/article/details/114578428)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [sklearn波士顿房价数据集——线性回归](https://blog.csdn.net/m0_57210162/article/details/120628434)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值