python爬虫系列: 数据存储(一)

本文介绍了Python爬虫数据存储的多种方法,包括json、csv、postgresql数据库、mongodb数据库和Redis缓存。详细讲解了每种存储方式的写入、读取操作,如json.loads()、csv.writer()、postgresql的DataFrame操作、mongodb的insert_one()和Redis的连接使用。
摘要由CSDN通过智能技术生成

大部分来源: python3:网络爬虫开发实战(第2版)

简要记录以下几种方式: json, csv, postgresql, mongodb, redis


一: json文件存储

字符串转json:       json.loads(str)

(注意python里的布尔值为True和False)

字符串里json的字符串不能用单引号

data='''{"name":"TOR","age":12}''' #里面的字符串不能用单引号
json_data=json.loads(data)

json文件内容转json:    json.load( open(filename, encoding= ) )

json_data=json.load(open('test.json',encoding='utf-8'))

json对象转文件(先用json.dumps()):       file.write( json.dumps(json_data) )

data='''{"name":"TOR","age":12}''' #里面的字符串不能用单引号
json_data=json.loads(data)
with open('data.json','w',encoding='utf-8')as file:
    file.write(json.dumps(data,indent=2))    #缩进更美观

或    json.dump(json_data,open(filename,'w',encoding='utf-8'))

json.dump(json_data,open('data.json','w',encoding='utf-8'))

二: csv

写入到csv文件    writer=csv.writer(file,delimiter=',')          writer.writerow([])

delimiter为分隔符,只能为1字符,可以为换行符(\n) <

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值