![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫
python爬虫实战
sushing
这个作者很懒,什么都没留下…
展开
-
Python实战之正则表达式
常用匹配规则 字符 作用 \w 匹配字母、数字、下划线 \W 匹配不是 字母和数字以及下划线 \s 匹配任意空白字符,等价于[\t\n\r\f] \S 匹配任意非空字符 \d 匹配任意数字 \D 匹配任意f非数字字符 \A 匹配字符串开头 \Z 匹配字符串结尾,若存在换行,只匹配到换行前的结束字符 \z 匹配字符串结尾,同时能匹配换行符 \G 匹配到最后匹配完成的位置 \n 匹配一个换行符 \t 匹配一个制表符 ^ 匹配一行字符串的开头原创 2020-07-14 22:23:05 · 397 阅读 · 0 评论 -
requests库的使用
基本用法 安装:pip install requests 实例1: 与urllib库中urlopen()方法相对应 import requests response = requests.get('http://www.baidu.com') print(type(response))//输出响应类型 print(response.status_code)//状态码 print(type(response.text))//响应体类型(为字符串str类型) print(response.cookies)//C翻译 2020-07-13 14:25:26 · 714 阅读 · 0 评论 -
基本库的使用
python3之模块urllib 阅读目录 1、urllib.request.urlopen() 2、urllib.request.Requset() 3、urllib.request的高级类 4、异常处理 5、解析链接 6、分析Robots协议 urllib是python内置的HTTP请求库,无需安装即可使用,它包含了4个模块: request:它是最基本的http请求模块,用来模拟发送请求 error:异常处理模块,如果出现错误可以捕获这些异常 parse:一个工具模块,提供了许多URL处理方法,如:拆翻译 2020-07-10 20:30:22 · 289 阅读 · 0 评论