自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 使用lxml库的Xpath解析网页:http://www.tipdm.com/,并循环打印网页中的连接

日常作业,打下卡#-*- codeing = uft-8 -*-#@Time :2021/4/16 14:03#@file : 4.16FridayWork.py#@Software: PyCharmimport requests #导入用到的requests库import time #time库可用可不用from lxml import htmletree = html.etreeurl = "http://www.tipdm.com/"result = requests.

2021-04-16 20:59:55 656

原创 《爬虫爬 wallhaven.cc壁纸》

##爬虫爬取网页壁纸在校生,最近学了学爬虫,自己尝试着写了一个关于爬网页壁纸的爬虫代码、话不多说,直接上代码#-- codeing = uft-8 --#@Time :2021/4/12 21:20#@file : SpiderWallhaven.py‘’‘代码爬取的是"https://wallhaven.cc/toplist?page=1"网页关于15行正则表达式解析的是每张图片的源地址,(不去解析图片的源地址将得到每张图片的缩略图只有解析它们的源地址,开展以下的爬取工作就交给循环)‘’’

2021-04-15 09:24:19 2596

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除