Pandas在读取csv时如何设置列名--常用方法集锦

最新推荐文章于 2024-05-31 09:44:10 发布

那记忆微凉

最新推荐文章于 2024-05-31 09:44:10 发布

阅读量8.2k

点赞数 3

分类专栏： Python

本文链接：https://blog.csdn.net/BigData_Mining/article/details/103206343

版权

54 篇文章

订阅专栏

今天来整理下如何在读CSV的时候正确处理列名。

csv文件自带列标题
原始数据是有列标的，用excel打开是这样的：

Screen Shot 2018-08-30 at 8.20.36 PM.png

import pandas as pd
df_example = pd.read_csv('Pandas_example_read.csv')

这种方法等同于

df_example = pd.read_csv('Pandas_example_read.csv', header=0)

结果都是：

在这里插入图片描述
csv文件有列标题，但是想自己换成别的列标题：

df_example = pd.read_csv('Pandas_example_read.csv')
df_example.columns = ['A','B','C']

df_example = pd.read_csv('Pandas_example_read.csv', names=['A', 'B','C'])

或者

df_example = pd.read_csv('Pandas_example_read.csv', header=0, names=['A', 'B','C'])

2.1和2.2效果都是一样的，读取文件，并且改列名：

在这里插入图片描述
csv文件没有列标题，从第一行就直接开始是数据的录入了：
原始数据是没有列标的，用excel打开呈现是这样的：

在这里插入图片描述

df_example_noCols = pd.read_csv('Pandas_example_read_withoutCols.csv', header=None)

这个时候一定要加’header=None’, 这样读进来的列名就是系统默认的0，1，2… 序列号：

Screen Shot 2018-08-30 at 8.14.00 PM.png

csv文件没有列标题，但是自己想加上列标题：

df_example_noCols = pd.read_csv('Pandas_example_read_withoutCols.csv', header=None)
df_example_noCols.columns = ['A', 'B','C']

df_example_noCols = pd.read_csv('Pandas_example_read_withoutCols.csv', names=['A', 'B','C'])

或者

df_example_noCols = pd.read_csv('Pandas_example_read_withoutCols.csv', header=None, names=['A', 'B','C'])

注意：这里不可以用’header=0’，用了之后就会导致第一行的数据先被当成了列名，然后又被重命名覆盖，结果是第一行的数据丢失。