应对掘金CDN开启防盗链 记一次爬取markdown图片的经历

当掘金和简书等平台限制外链图片时,作者通过编写Python脚本自动爬取Markdown中的图片,存储到本地并上传至GitHub仓库,以保持文章的完整性和美观。脚本包括获取Markdown文件、下载网络图片、重命名及上传到GitHub等功能。
摘要由CSDN通过智能技术生成

使用markdown写文章有什么好处?

markdown是一种纯文本格式(后缀.md), 写法简单, 不用考虑排版, 输出的文章样式简洁优雅
markdown自带开源属性, 一次书写后, 即可在任意支持markdown格式的平台发布 (国内支持的平台有, 掘金, 知乎(以文档方式导入), 简书(原本是最好用的, 最近在走下坡路))
著名代码托管平台github, 每个代码仓库的说明书README.md就是典型的markdown格式

原来我喜欢在 掘金或简书后台 写markdown文章, 然后复制粘贴到 gitbook(前提是gitbook已经和github做了关联), 就可以发布到github仓库, 由于内容很吸引人, 在github收获一波stars(stars相当于点赞)

但最近掘金和简书等平台突然宣布, 在自己网站存储的图片不再支持外链, 也就是在其它网站请求本站服务器存储的图片一律404 ! 简书是直接封了外链; 掘金发了一个公告, 延期一周执行;

怎么办?
我只好将md文档保存到本地, 然后根据md保存的源图片信息,使用爬虫爬取图片到本地, 然后将图片上传到github仓库(github仓库支持图片上传, 而且不封外链), 将原图片信息替换为github仓库保存的图片信息
首先在github新建一个名为 GraphBed 的仓库, 用来存储图片

将仓库clone到本地 的 /Users/lijianzhao/github文件夹

cd /Users/lijianzhao/github
git clone https://github.com/zhaoolee/GraphBed.git
复制代码

并保证 在此文件夹下, 有权限push到github, 权限添加方法 www.jianshu.com/p/716712278…
将github已有的.md文章对应的仓库下载到本地(以星聚弃疗榜为例)
git clone https://github.com/zhaoolee/StarsAndClown.git
复制代码

编写python脚本 md_images_upload.py

此脚本:

能搜索当前目录下所有md文件, 将每个md中的图片爬取到本地, 存放到/Users/lijianzhao/github/GraphBed/images目录;
图片爬取完成后, 自动将/Users/lijianzhao/github/GraphBed/images目录下的所有图片, push到Github
使用Github中的新图片地址,替换原图片地址
大功告成

import os
import imghdr
import re
import requests
impo

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值