【软件】如何进行有道云笔记导出,迁移到obsidian

1. 背景

有道云笔记用了很多年了,虽然诸多不便,但是懒惰(笔记太多懒得做迁移)让我一直坚持使用(并默默每天签到)。
结果这次有道直接放大招,限制2终端登陆。
在这里插入图片描述

服了。当断不断,必受其乱。
走。

心得

下定决心走,就得抓紧走,走得越迟,迁移工具更不兼容(有道会改接口和机制,但工具不会一直有好心人来做适配)。

最终结果

使用 youdaonote-pull + 4个pr + 部分debug + 部分手动调整, 实现了2700+篇 文档全部转移。附件 和 图片 转到本地。基本零损失。

2. 参考

3. 迁移计划

步骤其实很简单,就三步

  1. 不再修改/新增有道云云端内容,Freeze云端。
  2. 完整导出所有数据。
  3. 在obsidian中整理数据,归档。

3.1 冻结云端

因为导出数据是一个比较长时间的事情,需要验证各种导出工具.
为了保证每次测试结果的一致性,最好保证云端内容不要变动。
于是我卸载了多个终端(所有PC + 手机 + 平板)的所有有道云客户端,只留了主力机一份,用来临时查阅。

3.2 有道云笔记导出

这个是本次的重点,我的操作步骤如下:

3.2.1 有道云笔记官方导出 (用于比对)

在这里插入图片描述

虽然这个方法一直被大家诟病,但是我觉得有个优点是不可代替的,就是 又全又稳。
可以先用这个导一份出来,用snap2HTML 和wiztree去扫一遍,确认下自己一共有多少文档,多少附件,这样,后面用三方工具导出的时候,可以知道导出的内容全不全。

优点
  • 不会失败,所有文件全部导出,可以用做full list对比
  • 可以原名导出所有的附件
缺点
  • md文件导出是md,非md的笔记导出全是PDF,无法编辑。要搭配pdf转markdown使用(也没找到什么好用的工具)
  • 文档里插入的图片不会单独导出,全部变成PDF的一部分

3.2.2 使用YoudaoNoteExport (获取元数据json文件)

这个我没有尝试使用,因为要使用python2,而且基本功能已经被youdaonote-pull包含。所以我是直接略过了。

3.2.3 使用 youdaonote-pull 获取内容

优点
  • 可以直接转成md
  • 文章中的图片可以单独导出
缺点
  • 很多文件里的图片显示不出来(因为变成了octet-stream)。需要批量改名成尾缀。(去年拉取的时候还是正常的,今年就没了,感觉以后迁移成本原来越高了) (后面PR有解决)在这里插入图片描述- 感觉少了一些文件没有导出来(600/2700)。初步看下来,是一些比较老的文件 (后面PR有解决)
  • 部分复杂的文件,从note转换md失败(177/2700) (后面PR有解决)
  • 不能导出元数据(创建时间等) (后面PR有解决)
  • 超链接失效(后面PR有解决)

3.2.4 手动调整

遇到偶尔实在转换不了的文档,就自己手动调整下或者debug下,甚至可以直接删除该篇笔记。
(我2700篇只遇到3篇,怎么都调整不过去了,不知道是什么异常编码,也看不出来异常。就手动迁移了一下,然后在云端直接删掉了)

3.2.5 自己写工具

本来准备自己撸起柚子学一把再来改,突然发现PR里大伙已经把改动都改好了。。。所有我要的点都有PR。
开心,直接用,感受到了开源的力量。
以后要多看看issue。

3.2.6 PR

我用到的youdaonote-pull的PR如下(今天是20230805),可能目前还是PR。
也有可能你们用起来的时候已经merge了,直接拉主线下来就能用了。

PR1 , 修改len

这个PR1是修改了len,没改之前,我部分比较老的文档一直没导出来,总体少了500篇左右(这就是和官方导出 做 比较的意义)。
后来把len改成2000就全导出来了。
实测,len改太大会报错。

PR2, 修改空白表格导致转换错误

这个PR没打之前,有200多篇文档依然是 .note后缀,没有转成 .md。显示转换失败。
原因就是文档里有表格,表格里有空cell。
打上这个PR,会把空cell填一个空格进去再转换。
这个PR基本无害,打上之后,所有的.note就都转掉了。

PR3, 图片转换

这个就是我说,为什么下定决心走就要赶紧走。
我去年(2022年)12月用 youdaonote-pull 来拉取的时候,压根没有这个问题。当时拉下来的图片后缀名都是对的。
这两天(2023.8) 再拉,图片就变成了很多 octet-stream,需要另外适配。
在这里插入图片描述
这个PR基本无害,打上之后,所有的 octet-stream就转掉了。

PR4 元数据(创建时间等等)

这是我的诉求,也是一直在找的功能。
之前是计划用YoudaoNoteExport 来导出元数据的,后来看到了这个PR,果断直接合入。
功能是有了,导出来的md的确实带数据头。可以给obsidian读取。

要注意的就是,这个PR是依赖库的,要pip install一下更新的库。
在这里插入图片描述
但是实际测下来,有时候会偶尔中断。
看了下是编码异常,但是在笔记里也没看出什么奇怪的,
这也是我上面为什么删掉了三篇文档。
不过还好,相比收益,花个几十分钟调整一下笔记,我觉得没啥问题。

PR5 格式转换(粗体,超链接等等)

这个PR5包含了PR2的内容。

3. 总结

综合以上几步,基本内容就全部都导出来了。
可以看到,没有note后缀,所有文档都转成了md。
没有octec-stream后缀,所有插图都转成png 和jpeg。
在这里插入图片描述

基本做到无损,还是挺满意的。

迁移这件事挂在我的to do list里很久了,这套方法是我摸索出来比较可靠且成本较小的。
希望对大家有所帮助。
有道云现在的导出窗口越来越小,设置的障碍也越来越多,使用起来总担心越陷越深。
当然,我并没有说有道云不好,有道云对于大量追求便捷的人群来说,确实是个好工具,简单方便。
不过我不同。
我追求自由。

  • 6
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值