备忘录导出的HTML文档转换MarkDown尝试记录

本地备忘录写了些旅游攻略,想做个纪念,导出为长图片ok,导出为HTML,也可以。但是导出图片是base64格式的,所以导致特别大,7M-50M不等;没法直接把html导入到CSDN,或者其他旅游帖子平台。只支持导入MD格式的。

有俩个办法,在重写一遍攻略…,那也太浪费时间和痛苦了。
so 研究下,备忘录导出的HTML文档转换MarkDown。

1. pandoc命令行

# 要转换 hello.txt 从 Markdown 到 LaTeX:
pandoc -f markdown -t latex hello.txt

# 要将hello.html从 HTML 转换为 Markdown:
pandoc -f html -t markdown hello.html

# 支持的输入和输出格式列在下面的“选项”下(参见 -f 输入格式和 -t 表示输出格式)。你 还可以使用 pandoc --list-input-formats 和 pandoc --list-output-formats 来 打印支持格式的列表。

# 如果未显式指定输入或输出格式, Pandoc将尝试从文件名自动解析
pandoc -o hello.tex hello.txt

2. HTML转换MARKDOWN

eg:可以成功转为md,但图片是base64格式的,导入csdn会提示文章过长报错;

pandoc -f html -t markdown D:\Installsoft\pydemo\test1\6edbe23a7385b27f18cfac1179690909_25c5bbc2bf2c47815eaf2c48379a17a7_8.html -o D:\Installsoft\pydemo\test1\test.md

原始HTML如下:特意挑了个小的HTML,图片也比较少;
在这里插入图片描述

转换为test.md效果图如下:
可以看到文字都解析没问题,包括格式+小表情,然而图片就不堪一读了,超长的base64格式。
在这里插入图片描述

3. MD导入CSDN记录过长报错及压缩尝试

导入csdn效果图如下:图片base64格式不行…

在这里插入图片描述

分析原因:base64图片实在是太长了,转为md到页面还是根本没法导入,那就先压缩图片在导入吧;

最终以失败告终,即使图片压缩+等比例缩放图片宽高比后,base64还是很长,如下:
在这里插入图片描述

就这样吧,一次失败的尝试。

参考

  • 10
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 首先,您需要安装 Pythonmarkdown 库,然后您可以使用以下代码来批量将 markdown 格式的文件转换html 格式的文件: ``` import os import markdown # 遍历指定文件夹中的 markdown 文件 for file in os.listdir("path/to/markdown/files"): # 判断文件是否是 markdown 文件 if file.endswith(".md"): # 读取 markdown 文件内容 with open(file, "r") as f: content = f.read() # 使用 markdown 库将 markdown 格式转换html 格式 html = markdown.markdown(content) # 将 html 代码写入新文件 with open(file[:-3] + ".html", "w") as f: f.write(html) ``` 该代码会遍历 "path/to/markdown/files" 文件夹中的所有 markdown 文件,然后使用 markdown 库将它们转换html 代码,并将 html 代码写入新的 html 文件中。 ### 回答2: 使用Python批量将Markdown文件导出HTML文件的代码如下: ```python import os import markdown def convert_to_html(md_file): # 读取Markdown文件内容 with open(md_file, 'r', encoding='utf-8') as file: markdown_content = file.read() # 将Markdown内容转换HTML html_content = markdown.markdown(markdown_content) # 修改文件后缀名为.html html_file = os.path.splitext(md_file)[0] + '.html' # 将HTML内容写入文件 with open(html_file, 'w', encoding='utf-8') as file: file.write(html_content) print(f'Successfully converted {md_file} to {html_file}') def batch_convert_to_html(md_folder): # 遍历文件夹下的所有Markdown文件 for root, dirs, files in os.walk(md_folder): for file in files: if file.endswith('.md'): md_file = os.path.join(root, file) convert_to_html(md_file) # 批量导出Markdown文件为HTML文件 md_folder = 'path/to/markdown/folder' batch_convert_to_html(md_folder) ``` 使用这段代码,首先我们定义了一个`convert_to_html`函数,该函数接收一个Markdown文件的路径作为参数。函数内部读取Markdown文件内容,并使用`markdown`模块将其转换HTML内容。然后,我们修改文件后缀名为`.html`,并将HTML内容写入新文件中。 接下来,我们定义了`batch_convert_to_html`函数,该函数接收一个包含Markdown文件的文件夹路径作为参数。函数内部使用`os.walk`方法遍历文件夹下的所有Markdown文件,并调用`convert_to_html`函数将其转换HTML文件。 最后,我们设置了一个`md_folder`变量,指定包含Markdown文件的文件夹路径,并调用`batch_convert_to_html`函数进行批量转换。你只需将`md_folder`变量修改为你的Markdown文件所在的文件夹路径即可。 ### 回答3: 使用Python批量导出Markdown格式文件为HTML文件的代码可以使用Python的标准库markdown和os模块。 首先,需要导入所需的模块: ``` import markdown import os ``` 在代码中,首先需要指定要处理的Markdown文件所在的文件夹和导出HTML文件存放的文件夹: ``` input_folder = 'markdown_files_folder' # Markdown文件所在的文件夹 output_folder = 'html_files_folder' # 导出HTML文件存放文件夹 ``` 然后,可以使用os模块的listdir函数获取指定文件夹下所有文件的文件名: ``` file_names = os.listdir(input_folder) ``` 接下来,通过遍历上一步得到的文件名列表,使用markdown模块的markdown函数将Markdown文件转换HTML格式的文本,并将结果写入对应的HTML文件: ``` for file_name in file_names: if file_name.endswith('.md'): # 构造输入和输出的文件路径 input_file = os.path.join(input_folder, file_name) output_file = os.path.join(output_folder, file_name.replace('.md', '.html')) # 读取Markdown文件内容 with open(input_file, 'r', encoding='utf-8') as f: markdown_text = f.read() # 转换HTML格式 html_text = markdown.markdown(markdown_text) # 写入HTML文件 with open(output_file, 'w', encoding='utf-8') as f: f.write(html_text) ``` 以上就是使用Python批量导出Markdown格式文件为HTML文件的代码。通过遍历指定文件夹下的Markdown文件,将其逐个转换HTML格式并写入到指定文件夹下的HTML文件中。请注意,上述代码中需要调整文件夹路径为实际使用的文件夹路径。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序媛一枚~

您的鼓励是我创作的最大动力。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值