爬虫
文章平均质量分 65
wx-zhou
这个作者很懒,什么都没留下…
展开
-
Python 正则 —— 正则表达式断言
有关正则表达式的前要知识正则表达式断言解释正则表达式断言有以下类型:零宽正向先行断言;零宽负向先行断言;零宽正向后行断言;零宽负向后行断言。所谓的零宽断言,也就是与想要匹配字段的中间不能有其他字符,断言字符与想要匹配的字符是挨在一起的,比如说 (后行断言)匹配字符(先行断言) 先行断言是匹配字符后面紧挨着的内容,理解为:预匹配的字符串先行;后行断言是匹配字符前面紧挨着的内容,理解为:断言匹配内容在预匹配的字符串前面,下面我们分别来看一下这四种断言的语法格式,并进行具体情况使用分析:零原创 2021-04-25 09:02:23 · 2091 阅读 · 3 评论 -
python-pyquery 爬取网站图片尝试 —— 简单易懂
pyquerypyquery 是 python 中的一个第三方库,目前博主也在研究当中,最近发现用 pyquery 实现爬虫的方法会简单得多,下面就对 pyquery 的使用进行一些简单的演示。前面有一篇文章 —— 通过正则表达式进行网站图片的获取。本次实验的目的是使用 pyquery 进行网站图片的爬取并进行方法对比。pyquery 实战开始:from pyquery import PyQuery as pqimport requests# 导入pyquery模块里的PyQuery方法 这个方原创 2021-04-22 13:17:59 · 643 阅读 · 1 评论 -
Python 正则表达式爬取网站图片
使用正则表达式和 requests 模块前要知识所需模块学习路径rere模块知识总结requestsrequest模块学习路径通过 re 和 requests 模块便可完成简单的图片爬取功能。行动开始我们以素材8网站为例,对素材8首页存在的图片进行爬取。# 首先导入我们所需要用到的包import reimport requests# get 是request里的一个方法 它的意思是:从指定的资源请求数据。ret = requests.get("https原创 2021-04-22 09:17:27 · 2852 阅读 · 10 评论