Python爬虫糗事百科热图源码

最新推荐文章于 2021-12-26 03:04:01 发布

沉默且无语99

最新推荐文章于 2021-12-26 03:04:01 发布

阅读量177

点赞数 2

分类专栏： python 爬虫文章标签： python

本文链接：https://blog.csdn.net/gushuiwuqiu/article/details/117265748

版权

python 同时被 2 个专栏收录

15 篇文章 5 订阅

订阅专栏

爬虫

12 篇文章 1 订阅

订阅专栏

前言

生活索然无味，我们要留住快乐！

一、打开糗事百科热图

二、查看网页源码

代码

import requests
import re
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'}
url="https://www.qiushibaike.com/imgrank/page/%d/"
for pagenum in range(1,5):
 new_url = format(url%pagenum)
 response = requests.get(url=new_url,headers=headers).text
 ex= '<div class="thumb">.*?<img src="(.*?)" alt.*?</div>'
 img_list = re.findall(ex,response,re.S)
 for pages in img_list:
  pages = "https:"+pages
  url1=pages
  response1=requests.get(url=url1,headers=headers).content
  filename =  pages.split('/')[-1]
  img_path="./图片/"+filename
  with open(img_path,"wb") as fp:
   fp.write(response1)
   print("爬取成功")

运行结果

沉默且无语99

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫糗事百科热图源码

前言生活索然无味，我们要留住快乐！一、打开糗事百科热图二、查看网页源码代码import requestsimport reheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'}url="https://www.qiushibaike.com/imgrank/pa
复制链接

扫一扫