随笔
人生三醒七分醉
这个作者很懒,什么都没留下…
展开
-
笔记-urllib详解(一)
代码笔记,用于查询urlliburlopenurllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)import urllib.parseimport urllib.requestdata = bytes(urllib.parse....原创 2018-03-16 22:29:50 · 425 阅读 · 0 评论 -
笔记-requests详解(二)
实例引入import requestsresponse = requests.get('https://www.baidu.com/')print(type(response))print(response.status_code)print(type(response.text))print(response.text)print(response.cookies)各种请求方式im...原创 2018-03-17 14:02:02 · 351 阅读 · 0 评论 -
笔记-正则表达式(三)
正则表达式常见匹配模式模式描述\w匹配字母数字及下划线\W匹配非字母数字下划线\s匹配任意空白字符,等价于 [\t\n\r\f].\S匹配任意非空字符\d匹配任意数字,等价于 [0-9]\D匹配任意非数字\A匹配字符串开始\Z匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串\z匹配字符串结束\G匹配最后匹配完成的位置\n匹配一个换行符\t匹配一个制表符^匹配字符串的开头$匹配字符串的末尾...原创 2018-03-17 14:02:37 · 294 阅读 · 0 评论 -
笔记-pyquery(四)
安装 pip3 install pyquery初始化字符串初始化html = '''<div> <ul> <li class="item-0">first item</li> <li class="item-1"><a href="link2.html"原创 2018-03-17 14:03:07 · 206 阅读 · 0 评论 -
笔记-selenium(五)
安装 pip3 install selenium基本使用from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.common.keys import Keysfrom selenium.webdriver.support import expected_c...原创 2018-03-17 14:03:36 · 300 阅读 · 0 评论 -
Python3 爬虫中代理的使用方法
学爬虫我们已经了解了多种请求库,如 Requests、Urllib、Selenium 等。我们接下来首先贴近实战,了解一下代理怎么使用。下面我们来梳理一下这些库的代理的设置方法。1. 获取代理在做测试之前,我们需要先获取一个可用代理,搜索引擎搜索“代理”关键字,就可以看到有许多代理服务网站,在网站上会有很多免费代理,比如西刺:http://www.xicidaili.com/,这里列出了很多免费代...转载 2018-03-28 21:44:50 · 4037 阅读 · 1 评论