![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
Tcorpion
写着代码,喜欢着东方姑娘,陈乔恩
展开
-
phantomjs和selenium设置proxy、headers
#!/usr/bin/python# -*- coding:utf-8 -*-__author__ = 'Yl-Zh'import random,headers,xmlParsefrom bs4 import BeautifulSoupfrom selenium import webdriverfrom selenium.webdriver.common.desired_capabi原创 2017-04-17 16:51:45 · 14591 阅读 · 4 评论 -
Python-第三方库requests详解
Requests 是用Python语言编写,基于 urllib,采用 Apache2 Licensed 开源协议的 HTTP 库。它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTTP测试需求。Requests 的哲学是以 PEP 20 的习语为中心开发的,所以它比 urllib 更加 Pythoner。更重要的一点是它支持 Python3 哦!Beaut转载 2017-04-18 15:26:19 · 693 阅读 · 0 评论 -
利用Requests爬取图片和文本--博主比较懒
利用Requests爬取图片原创 2017-04-18 16:01:49 · 1009 阅读 · 3 评论 -
Scrapy官网tutorial、Requests官网文档、lxml官方文档、XPath语法、python核心模块pickle和cPickle讲解
博主比较懒,参考下面链接lxml官方文档: http://lxml.de/tutorial.htmlXPath语法:http://www.w3school.com.cn/xpath/xpath_syntax.asppython核心模块之pickle和cPickle讲解:http://www.pythonclub.org/modules/pickle原创 2017-04-18 17:12:43 · 933 阅读 · 0 评论