导出csdn博客为markdown格式

导出csdn博客为markdown格式

一直都是在csdn上写博客,2018年就开始写了,到现在都快四年了,写过的阅读量最多的一篇《m3u8文件下载的一种方式》,现在也有6万多次阅读了,现在csdn广告越来越多,越来越不喜欢了,还不如自己搭建一个博客,舒服自在。

之前写的自然是不能放弃,就想着将csdn的博客搬到自己的网站上,才发现由于年代久远,当时是用的是富文本编辑器,没办法导出markdown格式。没关系只要思想不滑坡,办法总比困难多。经过一番搜索,发现github上有个项目刚好能实现这个功能CSDNExporter当时他这个项目是运行在linux下了,需要以下条件:

  1. 安装必要的 Python 库, 如 requests, BeautifulSoup;
  2. 为了解析图片链接, 需要安装 aria2, 并保证能在命令行启动;
  3. 为了转换为 PDF, 需要安装 Pandoc

既然不能取之即用,干脆自己加工一下吧,嘿嘿。👻

首先安装必要的Python库,这个不是问题。

第二个,用aria2下载图片,这个有点大材小用了,python里面可以使用下面代码下载图片

from urllib.request import urlretrieve
urlretrieve(src, img_file)

第三个,转换PDF就不需要了,直接砍掉,嘿嘿🤪,而已用Typora也可以将markdown转换为PDF,我就不费头发去搞了

最后上成果:

这个图是csdn上面的用富文本编辑的原版:

image-20211202110955500

这个是我直接博客上面的样子,不能说毫不相关,只能说完美好吧!🥂

image-20211202111122343

具体代码已经上传到云盘,分为两个文件,记得先修改csdn_to_markdown.py下的article_url和markdown_dir变量,并且与utils.py放在同一个文件夹下。

article_url = '' #csdn博客链接
markdown_dir = '' #保存文件夹
download_csdn_single_page(article_url,markdown_dir)

公众号后台回复csdn2markdown,获取代码,公众号: Ys Treasure
本人新的博客地址blog.696969696.xyz
qrcode

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值