导出csdn博客为markdown格式
一直都是在csdn上写博客,2018年就开始写了,到现在都快四年了,写过的阅读量最多的一篇《m3u8文件下载的一种方式》,现在也有6万多次阅读了,现在csdn广告越来越多,越来越不喜欢了,还不如自己搭建一个博客,舒服自在。
之前写的自然是不能放弃,就想着将csdn的博客搬到自己的网站上,才发现由于年代久远,当时是用的是富文本编辑器,没办法导出markdown格式。没关系只要思想不滑坡,办法总比困难多。经过一番搜索,发现github上有个项目刚好能实现这个功能CSDNExporter当时他这个项目是运行在linux下了,需要以下条件:
既然不能取之即用,干脆自己加工一下吧,嘿嘿。👻
首先安装必要的Python库,这个不是问题。
第二个,用aria2下载图片,这个有点大材小用了,python里面可以使用下面代码下载图片
from urllib.request import urlretrieve
urlretrieve(src, img_file)
第三个,转换PDF就不需要了,直接砍掉,嘿嘿🤪,而已用Typora也可以将markdown转换为PDF,我就不费头发去搞了
最后上成果:
这个图是csdn上面的用富文本编辑的原版:
这个是我直接博客上面的样子,不能说毫不相关,只能说完美好吧!🥂
具体代码已经上传到云盘,分为两个文件,记得先修改csdn_to_markdown.py下的article_url和markdown_dir变量,并且与utils.py放在同一个文件夹下。
article_url = '' #csdn博客链接
markdown_dir = '' #保存文件夹
download_csdn_single_page(article_url,markdown_dir)
公众号后台回复csdn2markdown,获取代码,公众号: Ys Treasure
本人新的博客地址blog.696969696.xyz