Python网络爬虫(第七篇)——数据存储
一、 存储在文件中,包括TXT文件和CSV文件
二、 存储在MySQL数据库中。
基本存储:存储至TXT或CSV
1:存储至TXT:前期内容中使用过,存储仅需几行代码
with open("文件路径及文件名.txt",'读写模式')as f:
f.write("存储的数据")
几种打开文件的方式
读写方式 可否读写 若文件不存在 写入方式
w 写入 创建 覆盖写入
w+ 读取+写入 创建 覆盖写入
r 读取 报错 不可写入
r+ 读取+写入 报错 覆盖写入
a 写入 创建 附加写入
a+ 读取+写入 创建 附加写入
根据需要,我们可以采用不同的方式打开文件。
其中文件名的写法有三种形式:
1:with open(‘C:\User\desktop\title.txt’,’a+’)as f:
2: with open(r‘C:\User\desktop\title.txt’,’a+’)as f:
3:with open(‘C:/User/desktop/title.txt’,’a+’)as f:
2:把数据存储至CSV
CSV(Comma-Separate Values)是逗号分隔值的文件格式,其文件以纯文本的形式存储表格数据(数字和文本)。CSV文件的每一行都用换行符分隔,列与列之间用逗号分隔 。CSV即可用记事本打开,有可用Excel打开,表现为表格形式。这样可以整齐的看到数据的情况,而TXT文件格式经常遇到变量分隔的问题。
CSV的使用分为读取和写入两方面
一、 CSV的读取
首先创建一个CSV文件,如下图