1. MongoDB
(1)介绍与使用
mongoDB是一个c++写的高效的NoSql数据库。下载以后在文件夹下创建data/db/文件夹,存放数据。在bin目录新建start.bat(windows批量化执行)
START /B .\mongod.exe --dbpath ..\data\db
下次直接运行start.bat就可以运行数据库。
数据库的操作与查看可以使用mongo.exe 网上有相应的语法介绍,可以手动操作。但我更喜欢可视化数据库。我现在在使用robo 3T这个mongodb可视化软件,应该是qt写的,增删改挺方便的,就是浏览是分页查看的,刷新以后会回到第一页,这个体验不太好。
(2)pymongo
这是python操作数据库的库,api简洁,容易学习。
2. 数据库设计
数据库设计的原则是方便后面的操作。我设计的时候也没有外键设计,主键id mongo在插入时会生成,也基本用不到。ER图忘了怎么花了,就大概画一个简图吧。
说明:gzh collection是所有公众号管理合集,当爬取中断、回复、新增公众号时,都需要访问该collection。xxx collection 是以公众号命名的collection,该collection中保存文章。
有啥问题欢迎关注公众号直接后台问我,博客我不常上,但是公众号有消息推送,我会第一时间回复的。