scrapy-redis---------------------------直取豆瓣图书“狗头”
①:crawld 403拒绝访问
解决: setting.py中加入user-agent
②: 正则表达式的获取
re.search() re.search函数会在字符串内查找模式匹配,只要找到第一个匹配然后返回,如果字符串没有匹配,则返回None
re.S 会将这个字符串作为一个整体,将“\n” 换行当做一个普通的字符加入到这个字符串中...
原创
2018-12-11 12:18:58 ·
126 阅读 ·
0 评论