网安零基础学习-python-爬虫图片获取(灰帽编程18）

最新推荐文章于 2024-07-17 21:04:45 发布

ihan1001

最新推荐文章于 2024-07-17 21:04:45 发布

阅读量327

点赞数

分类专栏：零基础做灰帽文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/weixin_43491496/article/details/122535654

版权

零基础做灰帽专栏收录该内容

18 篇文章 4 订阅

订阅专栏

import urllib.request
import re
class GetHtml(object):
    def __init__(self,URL,HEAD):
        self.url=URL
        self.head=HEAD
    def get_index(self):
        self.request = urllib.request.Request(self.url)
        self.request.add_header("user-agent",self.head)
        self.response = urllib.request.urlopen(self.request)
        return self.response.read()
    def get_list(self):
        self.strimglist = []
        self.imglist = re.findall(b"style/\w{60}.jpg",self.get_index())
        #print(self.imglist)
        for i in self.imglist:
            self.strimglist.append(self.url+str(i,encoding="utf8"))
        return self.strimglist

    def get_image(self):
        num=0
        for self.url in self.get_list(self):
            num+=1
            with open(str(num+".jpg"),"wb") as f:
                f.write(self.get_index())
            
html = GetHtml("https://movie.douban.com/subject/1292052/photos?type=R","Mozilla/5.0 (Windows NT 8.1; Win32; rv:95.0) \
Gecko/20100101 Firefox/95.0")
#print(html.get_index(encoding="utf8"))


html.get_image()

#https://img0.baidu.com/it/u=333394868,1938696917&amp;fm=253&amp;fmt=auto&amp;app=138&amp;f=JPEG?w=889&amp;h=500

ihan1001

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
网安零基础学习-python-爬虫图片获取(灰帽编程18）

import urllib.requestimport reclass GetHtml(object): def __init__(self,URL,HEAD): self.url=URL self.head=HEAD def get_index(self): self.request = urllib.request.Request(self.url) self.request.add_header("user-agent
复制链接

扫一扫