python
Aivn
C、C++(Qt)、python
展开
-
Python正则表达式:findall、match、search、sub、贪婪&非贪婪模式
python作为兴趣爱好虽然很少用的工作中,但一些常用的如正则表达式学一学还是很有必要,以下主要为个人整理的学习笔记。目录1. re.findall()方法2. re.match()方法3. re.search()方法4.re.sub()方法5.贪婪模式与非贪婪模式6.常用元字符1. re.findall()方法import re'''遍历整个字符串,返回一个包含所有满足要求的数组'''s = 'hello python python python! p...原创 2020-11-03 09:14:33 · 2059 阅读 · 1 评论 -
python爬虫练习(二) 使用selenium +浏览器Firefox驱动爬取美女图片
同样是百度”图片“随便点开的一个网站,经过前面一章的练习,我们这次就说的快一点。 因为这次的网站后台使用了js做动态显示,需要使用鼠标滚轮滑倒最最最底部才能显示网页的全部内容,使用urllib已经不能满足我们的需求了 这里介绍另一种获取网页源码的方式js = "return document.body.innerHTML;"page_source = driver.execute_script(js)呀~,不想哔哔了,上章都讲的差不多了,直接贴源码得了:...原创 2020-08-12 11:12:22 · 397 阅读 · 0 评论 -
python爬虫练习(一),有挑选性的爬取网站上的美女图片
这里和大家分享以下我练习爬虫爬取网站上美女图片的学习笔记,不要笑话,点进来的你也是小色批。 提前说明:各大搜索引擎用的都是爬虫,很多权威的新闻网也都在爬取相关的新闻资料,爬虫不是贬义词(当然我们绝对不能拿他来做坏事)。 我下面列出了要爬取一个网站图片的主要步骤和方法,如果要爬取其他数据应该也是一样的步骤。目录一、安装库文件二、挑选网站得到URL,获取header三、分析网站结构,抓取网站后台代码简单分析规则四、使用正则匹配想要的链接...原创 2020-08-12 10:22:49 · 1227 阅读 · 2 评论