python写数据进csv_利用Python如何将数据写到CSV文件中

最新推荐文章于 2024-04-29 18:03:54 发布

yypmzqdf

最新推荐文章于 2024-04-29 18:03:54 发布

阅读量348

点赞数

文章标签： python写数据进csv

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35384453/article/details/113655597

版权

前言

我们从网上爬取数据，最后一步会考虑如何存储数据。如果数据量不大，往往不会选择存储到数据库，而是选择存储到文件中，例如文本文件、CSV 文件、xls 文件等。因为文件具备携带方便、查阅直观。

Python 作为胶水语言，搞定这些当然不在话下。但在写数据过程中，经常因数据源中带有中文汉字而报错。最让人头皮发麻的编码问题。

我先说下编码相关的知识。编码方式有很多种：UTF-8, GBK, ASCII 等。

ASCII 码是美国在上个世纪 60 年代制定的一套字符编码。主要是规范英语字符和二进制位之间的关系。英语词汇组成简单，由 26 个字母构成。使用一个字节就能表示一个字母符号。外加各种符号，使用 128 个字符就满足编码要求。

不同国家有不同语言文字。同时，文字组成部分的数量相比英语字母要多很多。根据不完全统计，汉字的数量大约将近 10 万个，日常所使用的汉字有 3000 个。显然，ASCII 编码无法满足需求。所以汉字采用 GBK 编码，使用两个字节表示一个汉字。简体中文的编码方式是 GBK2312。

那 UTF-8 又是什么编码？这要先说 Unicode 了。Unicode 目的是为了统一各种编码。因为各国都各自的编码方式。如果使用一种编码编码，使用另一种编码解码。这会造成出现乱码的情况。但 Unicode 只是一个符号集，它只规定了符号的二进制代码，却没有规定这个二进制代码应该如何存储。UTF-8 就是在互联网上使用最广的一种 Unicode 的实现方式。

因此，如果我们要写数据到文件中，最好指定编码形式为 UTF-8。

Python 标准库中，有个名为 csv 的库，专门处理 csv 的读写操作。

Python csv模块封装了常用的功能，使用的简单例子如下: # 读取csv文件

import csv

with open('some.csv', 'rb') as f: # 采用b的方式处理可以省去很多问题

reader = csv.reader(f)

for row in reader:

# do something with row, such as row[0],row[1]

import csv

with open('some.csv', 'wb') as f: # 采用b的方式处理可以省去很多问题

writer = csv.writer(f)

writer.writerows(someiterable)

具体使用实例如下： import csv

import codecs

# codecs 是自然语言编码转换模块

fileName = 'PythonBook.csv'

# 指定编码为 utf-8, 避免写 csv 文件出现中文乱码

with codecs.open(fileName, 'w', 'utf-8') as csvfile:

# 指定 csv 文件的头部显示项

filednames = ['书名', '作者']

writer = csv.DictWriter(csvfile, fieldnames=filednames)

books = []

book = {

'title': '笑傲江湖',

'author': '金庸',

}

books.append(book)

writer.writeheader()

for book in books:

try:

writer.writerow({'书名':book['title'], '作者':book['author']})

except UnicodeEncodeError:

print("编码错误, 该数据无法写到文件中, 直接忽略该数据")

这种方式是逐行往 CSV 文件中写数据，所以效率会比较低。如果想批量将数据写到 CSV 文件中，需要用到 pandas 库。

pandas 是第三方库，所以使用之前需要安装。通过 pip 方式安装是最简单、最方便的。

pip install pandas

使用 pandas 批量写数据的用法如下： import pandas as pd

fileName = 'PythonBook.csv'

number = 1

books = []

book = {

'title': '笑傲江湖',

'author': '金庸',

}

# 如果 book 条数足够多的话，pandas 会每次往文件中写 50 条数据。

books.append(book)

data = pd.DataFrame(books)

# 写入csv文件,'a+'是追加模式

try:

if number == 1:

csv_headers = ['书名', '作者']

data.to_csv(fileName, header=csv_headers, index=False, mode='a+', encoding='utf-8')

else:

data.to_csv('fileName, header=False, index=False, mode='a+', encoding='utf-8')

number = number + 1

except UnicodeEncodeError:

print("编码错误, 该数据无法写到文件中, 直接忽略该数据")

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对聚米学院的支持。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python写数据进csv_利用Python如何将数据写到CSV文件中

前言我们从网上爬取数据，最后一步会考虑如何存储数据。如果数据量不大，往往不会选择存储到数据库，而是选择存储到文件中，例如文本文件、CSV 文件、xls 文件等。因为文件具备携带方便、查阅直观。Python 作为胶水语言，搞定这些当然不在话下。但在写数据过程中，经常因数据源中带有中文汉字而报错。最让人头皮发麻的编码问题。我先说下编码相关的知识。编码方式有很多种：UTF-8, GBK, ASCII 等...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。