Dataset之mpg:mpg汽车油耗数据集的简介、下载、使用方法之详细攻略
目录
mpg汽车油耗数据集的简介
mpg,miles per gallon即油耗,这个数据集来自卡内基梅隆大学维护的StatLib库。1983年美国统计协会博览会使用了该数据集。这个数据集是对StatLib库中提供的数据集稍加修改的版本。根据Ross Quinlan(1993)在预测属性“mpg”中的使用,删除了 8 个原始实例,因为它们的“mpg”属性值未知。原始数据集在“auto-mpg.data-original”文件中。
该数据集共计9个特征,398个样本,用于回归任务。“该数据涉及城市周期燃料消耗(单位为每加仑英里),将根据3个多值离散和5个连续属性进行预测。”(昆兰,1993)
英文名 | 中文名 | 类型 | 备注 | |
1 | mpg | 油耗, miles per gallon | continuous | |
2 | cylinders | 气缸数量 | multi-valued discrete | |
3 | displacement | 排气量/排量 | continuous | |
4 | horsepower | 马力 | continuous | 存在6个缺失值 |
5 | weight | 重量 | continuous | |
6 | acceleration | 加速度 | continuous | |
7 | model_year | 出厂时间 | multi-valued discrete | |
8 | origin | 产地 | multi-valued discrete | 包含三个类别europe、japan、usa |
9 | name | 车品牌,比如bmw 320i | string (unique for each instance) |
1、origin产地详解
官网链接:UCI Machine Learning Repository: Auto MPG Data Set
mpg汽车油耗数据集的下载
下载链接:seaborn-data/mpg.csv at master · mwaskom/seaborn-data · GitHub
mpg汽车油耗数据集的使用方法
相关文章
ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序