python读取与写入csv格式文件的示例代码

最新推荐文章于 2024-05-01 09:45:05 发布

程序员阿牛

最新推荐文章于 2024-05-01 09:45:05 发布

阅读量545

点赞数

分类专栏： python 文章标签：程序员 python

本文链接：https://blog.csdn.net/sheiuh/article/details/102595381

版权

python 专栏收录该内容

31 篇文章 0 订阅

订阅专栏

本文介绍如何使用Python读取和写入CSV文件。通过示例代码展示了利用csv模块读取CSV为dict，批量写入dict数据到CSV，以及使用pandas将数据读写为DataFrame。此外，还提及了从zip文件中读取CSV和读取TXT文件为DataFrame的方法。

摘要由CSDN通过智能技术生成

在数据分析中经常需要从csv格式的文件中存取数据以及将数据写书到csv文件中。将csv文件中的数据直接读取为 dict 类型和 DataFrame 是非常方便也很省事的一种做法，以下代码以鸢尾花数据为例。
csv文件读取为dict
代码

-- coding: utf-8 --

import csv
with open(‘E:/iris.csv’) as csvfile:
reader = csv.DictReader(csvfile, fieldnames=None) # fieldnames默认为None,如果所读csv文件没有表头，则需要指定
list_1 = [e for e in reader] # 每行数据作为一个dict存入链表中
csvfile.close()
print list_1[0]
输出
{‘Petal.Length’: ‘1.4’, ‘Sepal.Length’: ‘5.1’, ‘Petal.Width’: ‘0.2’, ‘Sepal.Width’: ‘3.5’, ‘Species’: ‘setosa’}
如果读入的每条数据需要单独处理且数据量较大，推荐逐条处理然后再放入。
多条类型为dict的数据写入csv文件
代码

数据

data = [
{‘Petal.Length’: ‘1.4’, ‘Sepal.Length’: ‘5.1’, ‘Petal.Width’: ‘0.2’, ‘Sepal.Width’: ‘3.5’, ‘Species’: ‘setosa’},
{‘Petal.Length’: ‘1.4’, ‘Sepal.Length’: ‘4.9’, ‘Petal.Width’: ‘0.2’, ‘Sepal.Width’: ‘3’, ‘Species’: ‘setosa’},
{‘Petal.Length’: ‘1.3’, ‘Sepal.Length’: ‘4.7’, ‘Petal.Width’: ‘0.2’, ‘Sepal.Width’: ‘3.2’, ‘Species’: ‘setosa’},
{‘Petal.Length’: ‘1.5’, ‘Sepal.Length’: ‘4.6’, ‘Petal.Width’: ‘0.2’, ‘Sepal.Width’: ‘3.1’, ‘Species’: ‘setosa’}
]

表头

header = [‘Petal.Length’, ‘Sepal.Length’, ‘Petal.Width’, ‘Sepal.Width’, ‘Species’]
print len(data)
with open(‘E:/dst.csv’, ‘wb’) as dstfile: #写入方式选择wb，否则有空行
writer = csv.DictWriter(dstfile, fieldnames=header)
writer.writeheader() # 写入表头
writer.writerows(data) # 批量写入
dstfile.close()

list_1 = list()
for e in reader:
list_1.append(your_func(e)) # your_func为每条数据的处理函数

上述代码将数据整体写入csv文件，如果数据量较多且想实时查看写入了多少数据可以使用 writerows 函数。
读取csv文件为DataFrame
代码

读取csv文件为DataFrame

import pandas as pd
dframe = pd.DataFrame.from_csv(‘E:/iris.csv’)

也可以稍微曲折点：
import csv
import pandas as pd
with open(‘E:/iris.csv’) as csvfile:
reader = csv.DictReader(csvfile, fieldnames=None) # fieldnames默认为None,如果所读csv文件没有表头，则需要指定
list_1 = [e for e in reader] # 每行数据作为一个dict存入链表中
csvfile.close()
dfrme = pd.DataFrame.from_records(list_1)
从zip文件中读取指定csv文件为DataFrame
dst.zip文件中包含有dst.csv和其它文件，现在在不解压缩的情况下直接读取dst.csv文件为DataFrame.
import pandas as pd
import zipfile
z_file = zipfile.ZipFile(‘E:/dst.zip’)
dframe = pd.read_csv(z_file.open(‘dst.csv’))
z_file.close()
print dframe
DataFrame写入csv文件
dfrme.to_csv(‘E:/dst.csv’, index=False) # 不要每行的编号
读取txt文件为DataFrame
import pandas as pd