自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 scrapy代理IP

在middlewares.py中设置: class ProxyMiddleware(object):logger = logging.getLogger(__name__)def process_request(self, request, spider): self.logger.debug('Trying using proxy') request.meta['pro...

2018-09-10 18:44:47 1574 1

转载 selenium用法详解

selenium主要是用来做自动化测试,支持多种浏览器,爬虫中主要用来解决JavaScript渲染问题。 模拟浏览器进行网页加载,当requests,urllib无法正常获取网页内容的时候一、声明浏览器对象 注意点一,Python文件名或者包名不要命名为selenium,会导致无法导入 from selenium import webdriverwebdriver可以认为是浏览器的驱...

2018-09-05 17:06:29 139

转载 如何使用Headless Chrome

如何使用Headless Chrome Headless模式是Chrome 59中的新特征。 要使用Chrome需要安装chromedriver。from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionschrome_options = Options()chrome_o...

2018-08-27 15:01:59 1010

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除