Python 学习第四册第8章结构化的文本文件

weixin_38135241

于 2024-06-21 10:00:00 发布

阅读量557

点赞数 13

文章标签：学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38135241/article/details/139806448

版权

----用教授的方式学习。

目录

8.1结构化的文本文件

8.1结构化的文本文件

结构化的文本有很多格式，区别它们的方法如下所示。

• 分隔符，比如 tab（'\t'）、逗号（','）或者竖线（'|'）。逗号分隔值（CSV）就是这样的例子。

• '<' 和 '>' 标签，例如 XML 和 HTML。

• 标点符号，例如 JavaScript Object Notation（JSON2 ）。

• 缩进，例如 YAML（即 YAML Ain't Markup Language 的缩写），要了解更多可以去搜索。

• 混合的，例如各种配置文件。

每一种结构化文件格式都能够被至少一种 Python 模块读写。

8.1.1 CSV

你可以人工读入 CSV 文件，每一次读取一行，在逗号分隔符处将每行分开，并添加结果到某些数据结构中，例如列表或者字典。但是，最好使用标准的 csv 模块，因为这样切分会得到更加复杂的信息。

• 除了逗号，还有其他可代替的分隔符：'|' 和 '\t' 很常见。

• 有些数据会有转义字符序列，如果分隔符出现在一块区域内，则整块都要加上引号或者在它之前加上转义字符。

• 文件可能有不同的换行符，Unix 系统的文件使用 '\n'，Microsoft 使用 '\r\n'，Apple之前使用 '\r' 而现在使用 '\n'。

• 在第一行可以加上列名。

首先读和写一个列表的行，每一行包含很多列:

>>> import csv

>>> villains = [

... ['Doctor', 'No'],

... ['Rosa', 'Klebb'],

... ['Mister', 'Big'],

... ['Auric', 'Goldfinger'],

... ['Ernst', 'Blofeld'],

... ]

>>> with open('villains', 'wt') as fout: # 一个上下文管理器

... csvout = csv.writer(fout)

... csvout.writerows(villains)

数据可以是字典的集合（a list of dictionary），不仅仅是列表的集合（a list of list）。这次使用新函数 DictReader() 读取文件 villains，并且指定每一列的名字:

>>> import csv

>>> with open('villains', 'rt') as fin:

... cin = csv.DictReader(fin, fieldnames=['first', 'last'])

... villains = [row for

最低0.47元/天解锁文章

weixin_38135241

关注

13
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python 学习第四册第8章结构化的文本文件

python 结构化的文本文件
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

weixin_38135241 你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。