菜鸟-爬取百度贴吧美图并保存

最新推荐文章于 2022-06-19 15:08:13 发布

君18

最新推荐文章于 2022-06-19 15:08:13 发布

阅读量595

点赞数

分类专栏：菜鸟练习文章标签： python 爬虫

本文链接：https://blog.csdn.net/qq_35854409/article/details/70144146

版权

菜鸟练习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

from bs4 import BeautifulSoup
import random
import os
import re
import requests
url ='https://tieba.baidu.com/p/4814458788?pn='
headers ={'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"}
for i in range(1,53):
        page_url=url +str(i)
        html = requests.get(page_url , headers=headers)
        soup = BeautifulSoup(html.text, 'lxml')
        list = soup.select('img.BDE_Image')
        title = random.randint(1,10000)
        path = str(title).strip()
        os.makedirs(os.path.join("D:\patuw", path))
        os.chdir("D:\patuw\\"+path )
        for img in list:
            img_url = img.get('src')
            name = img_url[100:103]
            get_img =requests.get(img_url ,headers=headers )
            f =open(name+'.jpg','ab')
            f.write(get_img.content )
            f.close()

太菜，写了好久，代码也很烂，新手。

君18

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
菜鸟-爬取百度贴吧美图并保存

from bs4 import BeautifulSoupimport randomimport osimport reimport requestsurl ='https://tieba.baidu.com/p/4814458788?pn='headers ={'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/
复制链接

扫一扫