爬虫数据持久化的几种常用方法

1、txt

用普通的磁盘IO操作即可

2、csv

1 import csv
2 with open('xxx.csv','w') as f:
3   writer = csv.writer(f)
4   writer.writerow([])
5   writer.writerows([(),(),()])

需注意单条数据写入的参数格式是列表,多条数据写入的参数格式是列表嵌套元组,推荐使用多条数据一次性写入,效率高。

3、json:使用json模块中的dump函数

1 import json
2 data = {'xxx':'yyy'}
3 with open('zzz.json','w') as f:
4     json.dump(ob_data,f,ensure_ascii=False)

4、数据库:MySQL、MongoDB、Redis

存入MySQL:

 1 import pymysql
 2 # __init__(self):
 3 self.db = pymysql.connect('IP',... ...)
 4 self.cursor = self.db.cursor()
 5 # write_data(self):
 6 self.cursor.execute('sql',[data1])
 7 self.cursor.executemany('sql',[(data1),(data2),(data3)])
 8 self.db.commit()
 9 # main(self):
10 self.cursor.close()
11 self.db.close()

存入MongoDB:

import pymongo
# __init__(self):
self.conn = pymongo.MongoClient('IP',27017)
self.db = self.conn['db_name']
self.myset = self.db['set_name']
# write_data(self):
self.myset.insert_one(dict)
# MongoDB - Commmand
>show dbs
>use db_name
>show collections
>db.collection_name.find().pretty()
>db.collection_name.count()
>db.collection_name.drop()
>db.dropDatabase()

存入Redis:

  使用Redis中的字符串、列表、哈希、集合、有序集合进行存储

转载于:https://www.cnblogs.com/jason--/p/11372230.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值