爬取图片

最新推荐文章于 2023-10-22 12:00:00 发布

掌控ms

最新推荐文章于 2023-10-22 12:00:00 发布

阅读量225

点赞数

文章标签：爬虫

本文链接：https://blog.csdn.net/weixin_45754140/article/details/109339631

版权

import re
import requests
headers={
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'
}
url="https://segmentfault.com/a/1190000022760744?utm_source=sf-related"
html=requests.get(url=url,headers=headers)
next_url="https://segmentfault.com"
content=re.findall(pattern=r'<p><span class=".*?"><img referrerpolicy=".*?" data-src="(.*?)" src',string=html.text)
temp=0
print(content)
def save(url_sure):
    global temp
    temp+=1
    response=requests.get(url_sure,headers=headers)
    with open("D:\爬虫文件\图片\\"+str(temp)+'.jpg','wb')as f:
    #干,python最多创建1个文件。
        f.write(response.content)
if __name__ =='__main__':
    for i in content:

        save(next_url+i)