爬虫
文章平均质量分 78
一口木桶饭
意气风发,挥斥方遒!
展开
-
python爬虫之selenium的常用用法(一)
selenium是一个自动化的测试工具,简单来说就是模拟人的操作来打开浏览器去进行翻页,点击,下滑等操作 安装过程依旧pip install selenium 若是pycharm的安装可以参考这篇pycharm如何安装第三方库 对于selenium的使用我们用chrome浏览器为例,我们需要一个chromedriver驱动才可以使用,可以点击此网址下载对应的浏览器版本的驱动点此下载 下面开始介绍基...原创 2020-02-12 14:22:54 · 317 阅读 · 0 评论 -
python爬虫之PyQuery的常用用法
安装依旧很简单pip install pyquery,对于pycharm的安装看这篇pycharm安装第三方库 首先我们定义一个HTML文本段作为下边的例子 <html> <head> <title>this is a title</title> </head> <body> <p class="first...原创 2020-02-12 12:28:07 · 471 阅读 · 0 评论 -
python爬虫之BeautifulSoup4库的简单用法
BeautifulSoup4库是一个用来解析网页的库,多用于对网页数据的分析,整合,下面介绍一下他的安装依旧很简单pip insyall bs4就可以,若使用pycharm的话,可以点击settings然后搜索Project Interpreter,然后点击加号搜索bs4,点击install即可 以下是一些BeautifulSoup4的常用解析库 解析器 使用方法 优势 劣势 P...原创 2020-02-11 23:08:53 · 532 阅读 · 0 评论 -
python正则表达式的常用用法
先来一个正则表达式的表格,内容很多,但是用熟了就好了,下面是python3有关正则表达式的使用方法 符号表示 表达意义 \w 匹配字母数字以及下划线 [A-Za-z0-9_] \W 匹配除了字母数字和下划线之外的符号 [^A-Za-z0-9_] \d 匹配任意数字,就是[0-9] \D 匹配任意非数字的字符 ,就是[^0-9] \s 匹配任意空白字符,如空格 换行 ...原创 2020-02-09 17:39:44 · 189 阅读 · 0 评论