简书备份（导出）所有文章和图片的方法

最新推荐文章于 2024-04-16 09:40:30 发布

张云飞VIR

最新推荐文章于 2024-04-16 09:40:30 发布

阅读量701

点赞数 1

本文链接：https://blog.csdn.net/vir56k/article/details/105113329

版权

1.场景：

我在简书写了很多文章，考虑到文章的安全性，我希望定期备份下载我的文章，那么该怎么做呢？

2.整体思路

2.1.问题分解及实现思路

下载所有文章: 采用官方提供
下载所有图片：写个python脚本

3.操作步骤

3.1.设备环境

我的简书文章使用的 markdown 格式
电脑安装 Python 环境

3.2.第一步：下载所有文章

登录到简书 -> 点击个人头像 -> 选择设置 -> 账号管理 -> 点击下载所有文章

按下图操作

image.png

下载后的样子

image.png

3.3.第二步：写个python脚本

分解一些操作：

遍历文件夹和文件
打开文件，逐行读取
识别检索图片的描述符号，获得图片url，下载。

python 遍历文件夹

  for root, dirs, files in os.walk(dir_name):

python 遍历文件夹

  for root, dirs, files in os.walk(dir_name):

python 逐行读文件

f = open(a_markdown_file)
line = f.readline()
i = 0
while 1:
    line = f.readline()
    if not line:
        break
    i = i + 1
    ln = line[:-1]
    # print("[{}] [{}]".format(i, ln))
    process_line(ln, output_dir)
f.close()

markdowni的图片描述是下面这样样子，我们需要个正则表达式。

![image.png](https://upload-images.jianshu.io/upload_images/2044033-48c2eae384fc250c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

使用这个正则：

    img_list = re.findall(r"\!\[[^\]]*\]\((.+?)\)", line, re.S)

4.完整的 python 脚本：

我托管到GIthub，点击：完整代码

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

张云飞VIR

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

简书个人文章备份，图片批量导出小工具-附件资源

03-05

简书个人文章备份，图片批量导出小工具-附件资源

批量导出某个简书用户的所有文章列表和文章超链接

weixin_34274029的博客

05-06

216

简书改版后，根据文章标题搜索文章的功能就不见了。虽然简书提供了批量下载文章的功能，但是下载到本地的文章都是markdown格式的，不包含文章的链接，这不满足我的需求。既然我是程序员，没有这个功能我就自己实现一个。打开简书首页，发现默认只显示8篇文章，用鼠标滑动到屏幕底部后，会触发一个懒加载事件，到后台读取更多的文章列表，所以文章读取在服务器端是采取的分页实现。打开Chrome开发者工具...

参与评论您还未登录，请先登录后发表或查看评论

如何替换页面url_如何导出简书中的全部文章（包括图片）？

weixin_39557576的博客

12-02

237

上一篇文章让大家脱坑简书，这篇文章来具体说说如何脱坑。DealiAxy：为什么我不建议你使用简书这个平台写作？zhuanlan.zhihu.com 本文将教会你如何把简书中的所有文章（包括文章内的图片）进行导出，并且将利用这些文章建立自己的博客~首先，我们需要把自己在简书原有的文章导出，这里可以利用简书的导出文章功能，步骤如下：登录之后选择「设置」在设置页面先点击左侧的「账号管理」，然后在右边选...

将文章从简书迁移到 Hexo

xiasuhuei321的博客

05-29

1445

这两天抽空把简书的文章都迁移到了自己的博客中，这里小记一下。首先说明我这里的配置环境：本地安装好 hexo 配套环境阿里云服 Ubuntu 服务器中安装 git 和 nginx 简单配置原来是利用 github + hexo 来搭建自己的博客的，后来折腾了一下 wordpress，恩，感觉的确是够折腾的，还是改回 hexo 好了。在准备改回来的时候，我转念一想，github 也...

CSDN 文章导出

qq_39723157的博客

07-02

187

(function(){ 'use strict'; var articleBox = $("div.article_content"); articleBox.removeAttr("style"); $("#btn-readmore").parent().remove(); $("#side").remove(); $("#comment_title, #comment_list, #comment_bar, #comment_form, .announc...

简书常见问题.docx

09-27

2. **查看文章列表**：在我的主页中，可以看到已发布的所有文章和文集。 #### Q10：如何备份我的文章？为了保护用户的创作成果，简书提供了文章导出功能，方便用户备份自己的文章： 1. **设置菜单**：在设置菜单...

csdn2md:利用爬虫爬取指定用户的CSDN博客文章转为md格式，目的是完成博客迁移

05-02

2. **数据完整性**：确保所有文章的图片、链接和其他资源也能正确迁移，可能需要额外处理。 3. **版权问题**：在迁移博客时，要确保遵循CSDN的使用条款，尊重原创内容的版权。总结，`csdn2md`项目是一个实用的工具...

CSDN博客导出工具v4.1.zip

10-16

CSDN博客导出工具v4.1是一款高效、便捷的博客内容管理软件，旨在帮助用户快速、批量地导出个人或他人的博客文章，以备查阅和备份。其核心特性包括对多种博客平台的支持以及丰富的导出格式选择，确保用户可以按需定制...

CSDN文章数据导出工具

juemuren444的博客

02-28

934

平时写了博客，除了发布在自己的博客上，还会发布在知乎专栏和 CSDN（简书已经放弃了），发布之后会时不时的看看文章的阅读量等相关数据。由于 CSDN 的后台没有导出功能，就自己写了一个，查看起来比较直观。效果展示首先来看下导出的效果，我是仿照知乎的导出做的，上面是知乎，下面是我写的工具导出的 CSDN 的数据。开发背景 1、知乎上面也说到了，我写的这个功能是仿照知乎做的，那么知乎的...

干净标记：将文章转换为纯文本

02-04

➹清洁标记将博客文章转换为干净的Markdown文本文件。例例如，本文：转换为以下文本文件：用法 $ clean-mark“ ” 文章将使用URL路径名自动命名。在上述情况下，名称将为fancy-article.md 。可以指定文件类型： $ clean-mark“ ” -t html 可用的类型为：HTML，TEXT和Markdown。还可以指定输出文件和路径： $ clean-mark“ ” -o / tmp / article 在这种情况下，输出将是/tmp/article.md 。该扩展名是自动添加的。安装只需使用npm安装： $ npm

clean-markdown-theme:与 markdown 文件一起使用的干净 css 主题

07-21

干净的降价主题与 markdown 文件一起使用的干净 css 主题。此主题作为可用主题之一包含在 for Chrome 插件中。用法可以与应用程序一起使用。只需将 cleanTheme.css 文件放在 MacDown 的样式目录中。截屏谢谢感谢 Kevin Burke 的 [markdown-friendly stylesheet][style] [style]： :

.md（简书文档）文件如何转换为word或者pdf文件（格式好看）

01-16

将简书文档转换为word或者pdf，需要的插件，亲身试验感觉很不错

解决简书图片不显示问题“系统维护中，图片暂时无法加载”

zhengxiuchen86的博客

05-10

674

解决简书图片不显示问题“系统维护中，图片暂时无法加载”

android保存url图片到相册简书,[Android]创建图片

weixin_29194255的博客

05-27

360

Android开发中经常需要创建图片，而且从表现上来说，图片信息往往比文字信息更直观，更容易被人理解。所以创建图片的方法还是需要掌握的比较透彻，不应该像刚学Android开发一样——从别的地方复制过来再修改。虽然我就是刚入门目前接触到的都是通过Bitmap生成图片文件，所以创建Bitmap就成为了工作的第一布。Bitmap的创建往往是通过createBitmap方法来实现。createBitmap...

网页转 markdown 的工具

车子（chezi）

02-12

2602

文章目录背景准备工作安装 clean-mark如何使用效果展示参考资料背景想把我在 CSDN 的博客备份下来，最好是 markdown 格式。在探索的过程中发现了一款工具——clean-mark 它的仓库地址是： https://github.com/croqaz/clean-mark 有人问为什么不保存成 html，而是要保存成 markdown 呢？ clean-mark 在项目主页已经说得很清楚了： to save interesting articles offline, in a high

一个工具简单实现简书、掘金、CSDN上一些优秀的文章保存成markdown文件

玖柒IT

11-28

5357

探索 Clean-Mark：纯正的 Markdown 清理工具