DataFrame有一个重要的属性——columns,也就是数据集的列名。先前提到过,我们可以在导入数据的时候设置names参数,也可以在导入数据之后设置该数据集的columns属性。今天我们来归纳一下若干种修改列名的方式。我们还是使用ufo这个DataFrame。
ufo = pd.read_csv(r"ufo.csv")
(1)在导入数据的时候设置names参数
如果想把空格改成下划线,那么我们可以这样来做:
col_names = ["City","Colors_Reported","Shape_Reported","State","Time"]
ufo = pd.read_csv(r"ufo.csv", header = 0, names = col_names)
(2)在导入数据之后设置columns属性
col_names = ["City","Colors_Reported","Shape_Reported","State","Time"]
ufo = pd.read_csv(r"ufo.csv")
ufo.columns = col_names
(3)使用键值对(字典)来设置某一个或某几个列的名称
ufo = pd.read_csv(r"ufo.csv")
ufo.rename(columns = {"Colors Reported" : "Colors_Reported",
"Shape Reported" : "Shape_Reported"}, inplace = True)
(4)使用string方法
ufo = pd.read_csv(r"ufo.csv")
ufo.columns = ufo.columns.str.replace(" ","_")