- 博客(2)
- 收藏
- 关注
原创 python实现令牌桶
import multiprocessingimport timeimport redisfrom cfg import PROXY_REDIS_CFGfrom common import redis_poolproxy_redis_cfg = PROXY_REDIS_CFG['dev']redis_pool.init_redis(proxy_redis_cfg)TEST = ...
2019-05-25 14:14:49 1189
原创 python scrapy 爬取包含iframe标签内的数据
如图所示: 所要提取的数据都在iframe标签里面的,直接用xpath提取iframe标签里的内容是提取不到的,看到图一有一个script 所有的数据都在这个js标签内的,展开script标签后会看到一堆js代码,一直往下找会发现一个bytes类型的数据,如图这个红色的源码就是你要的数据,但是他是一个bytes类型的,提取出来之后需要你转一下格式,这里推荐使用import urllib...
2019-05-25 11:50:01 7226 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人