Python多线程爬取知乎获赞过千的答案链接
最近因维护微信公众号需要,想用Python自动获取知乎上获赞过千的答案。于是想到了爬虫,当然一开始做得很简单,仅仅是单线程的爬取。后来发现速度实在太慢,就开发了多线程功能。关键的地方都加了注释,思想也不复杂,所以直接上代码:#coding=utf-8
import urllib2,re,os,threading#使用正则匹配出所需部分
def spider(url):
try:
原创
2015-08-10 19:20:59 ·
1599 阅读 ·
1 评论