抓取豆瓣电影top250 https://movie.douban.com/top250 中的电影图片，并保存到文件夹picture中。

最新推荐文章于 2022-12-29 14:26:57 发布

写代码好难

最新推荐文章于 2022-12-29 14:26:57 发布

阅读量801

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/qq_45691937/article/details/117756678

版权

python 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

抓取豆瓣电影top250 https://movie.douban.com/top250 中的电影图片，并保存到文件夹picture中。

import requests
from bs4 import BeautifulSoup
import lxml
def get(url):
    try:
        user_agent="Mozilla/5.0(compatible;MSIE 9.0;Windows NT 6.1;Trident/5.0;)"
        headers={"User-Agent":user_agent}
        '''headers = {
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36"
}'''
        r=requests.get(url,headers=headers,timeout=30)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        return "产生错误"
url="https://movie.douban.com/top250"
#pdb.set_trace() 
soup=BeautifulSoup(get(url),"lxml")
movie=soup.find_all("img")#查找img
x=1#控制打印次数
for i in movie:
    imgsrc=i.get("src")
    response = requests.get(imgsrc) 
    #print(imgsrc)
    #print("下载第%s张中"%x)
    file = open("/home/aistudio/picture/%s.jpg" %x,"wb") 
#写入文件
    file.write(response.content) 
    x+=1

    
#关闭操作
print("下载完成")

写代码好难

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
抓取豆瓣电影top250 https://movie.douban.com/top250 中的电影图片，并保存到文件夹picture中。

抓取豆瓣电影top250 https://movie.douban.com/top250 中的电影图片，并保存到文件夹picture中。import requestsfrom bs4 import BeautifulSoupimport lxmldef get(url): try: user_agent="Mozilla/5.0(compatible;MSIE 9.0;Windows NT 6.1;Trident/5.0;)" headers={"User-
复制链接

扫一扫