用python处理csv格式文件
在各种平台上获取数据时,我们常常获得的是csv格式的文件。csv格式是一种逗号分隔值的文件格式,它并不是非常reader-friendly。所幸,python标准库中的csv模块可以帮助我们轻松处理csv格式文件。下面将以分析我国2010-2019年gdp为例简单介绍用python处理csv格式文件的过程。
-
数据准备
本例中使用的csv格式数据可以在国家统计局官网上获得,有兴趣的小伙伴可以下载下来,实战一下。数据源 -
分析csv文件头
为了在python中处理csv文件,我们需要导入csv模块,并创建一个阅读器(reader)对象。具体代码如下。import csv def main(): filename = 'GDP_data.csv' with open(filename) as f: reader = csv.reader(f) # 创建一个与该文件相关的阅读器 next(reader) next(reader) # 跳过表头 header_row = next(reader) # 用next()读取一行 print(header_row)
执行main()函数,就可以看到
-
拆分文件头
有时候文件头中的条目较多,一个一个核对非常麻烦,这时候就可以用enumerate函数将文件头拆分成索引序列