在准备将网页转pdf的时候,发现无法将图片下载下来，打开便是损坏的

最新推荐文章于 2024-06-08 13:23:42 发布

此用户被停封

最新推荐文章于 2024-06-08 13:23:42 发布

阅读量1.7k

点赞数

分类专栏：爬虫图片下载的问题文章标签：爬虫

本文链接：https://blog.csdn.net/weixin_43357339/article/details/89007278

版权

爬虫图片下载的问题专栏收录该内容

1 篇文章 0 订阅

订阅专栏

我在执行该文件，发现图片可以下载下来，但是大小只有1kb，打开便是显示文件损坏

from bs4 import BeautifulSoup
import requests, time, html5lib, pdfkit, os

headers = {
			     'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)    AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121      Safari/537.36'
			     }     


def get_info(url):    
    res = requests.get(url,headers=headers)    
    soup = BeautifulSoup(res.content,'html5lib')    
    content = soup.find(class_="winstyle45572")    
    c = content.find_all("img")         
    for img in c:
     	im = requests.get('http://www.hnuahe.edu.cn/'+img['src'])
     	filename = os.path.split(img['src'])[1]
     	with open('学校/image/'+filename, 'wb') as f:
         		f.write(im.content)

   
       if __name__ == "__main__":    
       		urls = ['http://www.hnuahe.edu.cn/info/1033/{}.htm'.format(str(i)) for i in range(1700, 1720)]    
       			for url in urls:
       			 	get_info(url)
       		time.sleep(0.5)

其中还有一些莫名的错误，希望可以解答一下。

此用户被停封

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
在准备将网页转pdf的时候,发现无法将图片下载下来，打开便是损坏的

我在执行该文件，发现图片可以下载下来，但是大小只有1kb，打开便是显示文件损坏from bs4 import BeautifulSoupimport requests, time, html5lib, pdfkit, osheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) Apple...
复制链接

扫一扫