最近在学习Python爬虫,平常将爬取的数据都存入Excel表格中,但是当数据量大的时候存取和查、删、改就不方便了,这时数据库就是你很好的选择了(其实我就是觉得使用Excel好low而已),在学习的过程中开始接触mongodb这个数据库,mongodb是一种非关系型数据库,数据存取的形式与Python中的字典很相似,所以在Python中使用mongodb是一个不错的选择,废话不多说,下面总结一下我最近学习的东西:
1、在Windows上安装pymongo
这部分就不多说了,安装还是挺简单的,没有出现像其他一些包安装的问题(没错,我说的就是scipy,scrapy等包)
2、使用pymongo初始化数据库
from pymongo import MongoClient
client = MongoClient()
#创建数据库,两种方式
db = client.peopleinfo #方式一
db = client['peopleinfo'] #方式二
#创建数据表,