- 博客(2)
- 收藏
- 关注
原创 使用lxml库的Xpath解析网页:http://www.tipdm.com/,并循环打印网页中的连接
日常作业,打下卡#-*- codeing = uft-8 -*-#@Time :2021/4/16 14:03#@file : 4.16FridayWork.py#@Software: PyCharmimport requests #导入用到的requests库import time #time库可用可不用from lxml import htmletree = html.etreeurl = "http://www.tipdm.com/"result = requests.
2021-04-16 20:59:55 656
原创 《爬虫爬 wallhaven.cc壁纸》
##爬虫爬取网页壁纸在校生,最近学了学爬虫,自己尝试着写了一个关于爬网页壁纸的爬虫代码、话不多说,直接上代码#-- codeing = uft-8 --#@Time :2021/4/12 21:20#@file : SpiderWallhaven.py‘’‘代码爬取的是"https://wallhaven.cc/toplist?page=1"网页关于15行正则表达式解析的是每张图片的源地址,(不去解析图片的源地址将得到每张图片的缩略图只有解析它们的源地址,开展以下的爬取工作就交给循环)‘’’
2021-04-15 09:24:19 2596
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人