笔记
uziwz_
python爱好者
展开
-
requests库的用法
requests介绍 requests库是python优秀的第三方http请求库,使用起来简洁强大,需要额外安装。 可使用pip工具安装 : pip install requests 基本用法 请求网页 import requests response = requests.get("https://www.baidu.com") 仅需简单一步便可实现各种方法的请求(还有post(), p...原创 2019-08-21 11:07:00 · 171 阅读 · 0 评论 -
正则表达式基本用法
正则表达式介绍 正则表达式是处理字符串的强大工具,常用来实现字符串的检索,替换,匹配验证等,正则表达式在各种编程语言中都能使用。 1.常用的匹配规则 \w 匹配字母,数字及下划线 \W 匹配不是字母,数字及下划线 \s 匹配任意空白字符 \S 匹配任意非空白字符 \d 匹配任意数字 \D 匹配任意非数字的字符 \A 匹配字符串的开头 \Z 匹配字符...原创 2019-08-21 15:12:38 · 113 阅读 · 0 评论 -
urllib库的基本使用
urllib库介绍 urllib是python3内置的HTTP请求库,包含request,error,parse,robotparser四个基本模块,分别用于发送请求,异常处理,URL解析处理,识别robots协议。 request模块 urlopen() 方法 urlopen(url, data=None, [timeout,]*, cafile=None, capath=None, cad...原创 2019-08-21 15:14:51 · 179 阅读 · 0 评论 -
XPath库的用法
XPath解析库的基本用法 XPath介绍 XPath全称XML Path Language(XML路径语言),是一门在XML文档中查找信息的语言,同样可查找HTML文档. 所以在写爬虫时可使用XPath来做相应的信息提取. (使用XPath需安装lxml库) XPath常用规则 // 从当前节点选取子孙节点 / 从当前节点选取直接子节点 . 选取当前节点 … 选取当前节点的父节点 @ 选取...原创 2019-09-05 15:56:10 · 613 阅读 · 0 评论