![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python爬虫
新一人
君子之道,辟如行远必自逊,辟如登高必自卑
展开
-
Python爬虫之Lxml库与Xpath语法
Lxml库是基于lbxml2的XML解析库的Python封装。作用:使用Xpath语法解析定位网页数据。LXMl库的安装与使用方法Lxml库的安装windows系统下的安装:#pip安装pip3 install lxml#wheel安装#下载对应系统版本的wheel文件:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lx...原创 2019-07-31 15:48:00 · 539 阅读 · 0 评论 -
Python爬虫之正则表达式
首先我们要明白正则表达式是什么,用来作什么正则表达式是一个特殊的符号序列,他帮助开发人员检查是否与某种模式匹配。正则表达式常用的符号一般字符说明:"."字符为匹配单个字符。例如,a.b可以的匹配结果为abc,aic,a&c等等,但不包括换行符"\"字符为转义字符,例如“\n”。"[...]"为字符集,相当于在中括号中任选一个。例如a[bcd],匹配的结果为...原创 2019-08-04 18:46:00 · 260 阅读 · 0 评论 -
Python爬虫之爬虫原理并实现第一个爬虫
主要知识点: 网络连接: 根据图2.1我们可以知道计算器通过向服务器发送Request请求,可以得到相应的Response。其中Request包括请求头和消息体,Response包括html文件。其实计算机的一次Request请求和服务器的一次应答就是网络连接的体现。 其中我们可以把计算机比作向...原创 2019-07-30 16:51:00 · 382 阅读 · 0 评论