爬虫
mzbqhbc12
这个作者很懒,什么都没留下…
展开
-
python 爬虫 一键爬取 淘宝天猫宝贝页面主图颜色图和详情图
import requestsimport re,sys,osimport jsonimport threadingimport pprintclass spider: def __init__(self,sid,name): self.id = sid self.headers = { "Accept":"text/html,ap原创 2017-02-12 00:13:08 · 8561 阅读 · 5 评论 -
python 爬虫 批量获取代理ip
import urllib.requestimport os, re,sys,timetry: from StringIO import StringIOexcept ImportError: from io import StringIOloca = re.compile(r"""ion":"\D+", "ti""")#伪装成浏览器header = {'User-原创 2017-02-12 01:13:08 · 1852 阅读 · 0 评论