利用Scrapy框架爬取博客园精选区前n页的博客题目、点赞数、链接
将数据写入数据库或生成*.xml文件
代码
#Scrapy框架模板
# import pymongo
import scrapy
# client = pymongo.MongoClient()
# mydb = client['mydb']
# cnblogs = mydb['cnblogs']
class CnBlogSpider(scrapy.Spider):
name = ...
原创
2018-05-12 22:21:34 ·
401 阅读 ·
0 评论