![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫项目
hrflex
这个作者很懒,什么都没留下…
展开
-
利用re模块爬取煎蛋网美女图(菜单改良升级版)
我爬取的是原图,比页面的图片清楚一些,而且可以连续爬取多个页面的图片 效果图: 源代码: import requests import re import os from prettytable import PrettyTable img_rule = re.compile(r'<p><a href="(.*?)" target="_blank" class="view_img_link"',re.S) next_rule = re.compile...原创 2022-02-18 22:22:11 · 397 阅读 · 0 评论 -
利用requests, xpath爬取站长网简历模板
导入模块:requests, lxml, os import requests from lxml import etree import os # 创建一个文件夹 def mkdir(path): isExists = os.path.exists(path) if not isExists: print('创建名字叫做', path, '的文件夹') os.makedirs(path) # 获取htm链接,并返回一个完整的htm链接,获取标题 .原创 2022-02-16 15:23:59 · 630 阅读 · 0 评论