首先用wps打开文件,如果有批注先删除批注
选中其他一条批注,然后点击审阅 =》删除 =》 删除所有批注
将文件保存未html格式
点击文件 =》另存为
选择文件类型: 网页文件(htm)
删除多余代码
用编辑器打开,我使用的是vscode,然后格式化一下代码,删除多余的代码,只留boby标签里面的代码
删除前
删除后:
将body标签改成div标签,删除注释,ctrl+f搜索这个文件,删除带有!(英文感叹号)的内容,否则rich-text不能解析。
通过脚本生成目标文件
通过脚本将html文件转换成对应的json文件
const fs = require("fs");
const path =
"/Users/justtoday/Desktop/111.html";
const path_out =
"/Users/justtoday/Desktop/111.json";
const title = "111";
const txt = fs.readFileSync(path, { encoding: "utf-8" });
const data = {
title,
content: txt,
};
fs.writeFileSync(path_out, JSON.stringify(data, null, 4));
path:是你文件的绝对路径
path_out:是你的目标文件绝对路径
6. 运行这个脚本,在对应的路径下就能生成一个json文件
{
"title": "111",
"content":""
}
content就是转换后的内容