- 数据集下载到本地保存,可以在sublime text中查看 XX.data文件
2.代码示例
import pandas as pd
# car.data 数据集中一共有7列,前6列是特征,最后一列是label
# 这里使用names 参数设置列名,如果不填写names则读出来的dataframe没有列名。列名来源于UCI数据官网关于car.data数据集的介绍
raw_dataset = pd.read_csv("../dataset/car.data", names=["buying", "maint", "doors", "persons", "lug_boot", "safety", "label"])
# 把label=good的数据标记为正类,其他的标记为负类
raw_dataset.loc[raw_dataset.label != "good", 'label'] = 0
raw_dataset.loc[raw_dataset.label == "good", 'label'] = 1
#将处理好的数据集存储在csv文件中
raw_dataset.to_csv("../dataset/car.csv", index=False)