<爬虫>用正则爬取B站首页图片

最新推荐文章于 2022-01-03 21:30:29 发布

weixin_30817749

最新推荐文章于 2022-01-03 21:30:29 发布

阅读量428

点赞数

文章标签：爬虫

原文链接：http://www.cnblogs.com/shuimohei/p/10335750.html

版权

import re
import requests
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'
}
url = "https://www.bilibili.com/"
response = requests.get(url,headers=headers)
html = response.text
pattern = re.compile(r"<div.*?groom-module home-card.*?<img.*?src=(.*?)alt",re.S)
items = re.findall(pattern,html)
i = 0
for item in items:
    item = "http:"+ re.sub('"','',item)
    r = requests.get(item)
    with open("D:\\TEST\\"+str(i)+'.jpg','wb') as f :
        f.write(r.content)
        print("图片:"+str(i)+'.jpg'+"写入成功!")
    i+=1

B站首页情况:

运行结果:

转载于:https://www.cnblogs.com/shuimohei/p/10335750.html

优惠劵

weixin_30817749

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
<爬虫>用正则爬取B站首页图片

import reimport requestsheaders = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'}url = "https://ww...
复制链接

扫一扫