Markdown和Word如何相互转换

Aqua_chang

已于 2025-05-05 15:05:01 修改

阅读量2k

点赞数 29

分类专栏： markdown教程文章标签： python notion word 学习笔记

于 2025-04-24 11:34:12 首次发布

本文链接：https://blog.csdn.net/Aqua_chang/article/details/147355537

版权

markdown教程专栏收录该内容

4 篇文章

订阅专栏

本文将详细介绍如何将Markdown文档转换为Word文档，以及如何将Word文档转换为Markdown格式，帮助您在不同文档格式间轻松切换。

一、在线转换工具

1. Zamzar（有在线免费版和在线月卡版）

网址：Zamzar
简介：Zamzar 是一个在线文件转换工具，支持多种文件格式之间的转换，包括 Markdown 和 Word。
操作步骤：
1. 访问 Zamzar 网站。
2. 点击“添加文件”按钮，选择要上传的 Markdown 或 Word 文件。
3. 在下拉菜单中选择目标格式（Markdown 或 Word）。
4. 输入邮箱地址以接收转换后的文件。
5. 点击“转换”按钮，等待转换完成并查收邮件。

2. CloudConvert（强烈推荐，可以一次转换多个）

网址：CloudConvert
简介：CloudConvert 是另一个强大的在线文件转换工具，支持多种文件格式，包括 Markdown 和 Word。
操作步骤：
1. 访问 CloudConvert 网站。
2. 点击“选择文件”按钮，上传要转换的 Markdown 或 Word 文件。
3. 在目标格式中选择 Markdown 或 Word。
4. 点击“转换”按钮，下载转换后的文件。

二、图形化界面工具

1. Typora

官网：Typora
简介：Typora 是一款流行的 Markdown 编辑器，支持实时预览和导出多种格式，包括 Word。
操作步骤（Markdown 转 Word）：
1. 打开 Typora 编辑器。
2. 打开要转换的 Markdown 文件。
3. 点击菜单栏的“文件”->“导出”->“Word (.docx)”。
4. 选择保存路径并保存文件。
操作步骤（Word 转 Markdown）：
1. 打开 Typora 编辑器。
2. 点击菜单栏的“文件”->“打开”，选择要转换的 Word 文件（.docx）。
3. 点击菜单栏的“文件”->“另存为”，选择保存路径，将文件类型选择为 Markdown (.md)，然后点击“保存”。

三、命令行工具

1. Pandoc

官网：Pandoc
简介：Pandoc 是一个开源的文档转换工具，支持多种格式的转换，包括 Markdown 和 Word。虽然它主要通过命令行操作，但也有一些基于 Pandoc 的图形化界面工具，如 PanWriter。
操作步骤（使用命令行）：
- 安装 Pandoc：从 Pandoc 官网下载安装包并安装。
  - msi安装包适合：希望完全集成到系统的用户，或需要为所有用户安装的情况，是标准的Windows安装程序。
    - 自动配置环境变量
    - 支持静默安装/卸载
    - 系统会记录安装信息
  - zip压缩包适合：需要临时使用/测试的用户，或希望避免修改系统注册表的场景，是压缩包形式的便携版本。
    - 无需安装，解压即用
    - 可放在U盘随身携带
    - 多版本共存更方便
- 转换文件：
  - Markdown 转 Word：在命令行中输入 pandoc input.md -o output.docx。
  - Word 转 Markdown：在命令行中输入 pandoc input.docx -o output.md。
图形化界面工具（可选）：使用 PanWriter 或其他基于 Pandoc 的 GUI 工具进行转换。

四、Python脚本批量处理

1. 用 Python 和 Pandoc 进行批量转换

以下是一个使用 Python 脚本结合 Pandoc 进行批量转换的示例代码：

# 导入必要的模块
import os  # 用于与操作系统交互（如检查文件路径、创建目录等）
import sys  # 用于处理命令行参数和退出程序
import subprocess  # 用于执行外部命令（如调用Pandoc工具进行文件转换）

def check_args():
    """
    检查命令行参数是否正确。
    正确的参数格式为：python script.py <input_directory> <output_directory> <operation_type>
    """
    # 检查命令行参数的数量是否为4（包括脚本名本身）
    if len(sys.argv) != 4:
        print("Usage: python script.py <input_directory> <output_directory> <operation_type>")
        sys.exit(1)  # 如果参数数量不正确，打印提示信息并退出程序[[2]]
    
    # 获取输入目录、输出目录和操作类型
    input_dir = sys.argv[1]  # 第一个参数是输入目录
    output_dir = sys.argv[2]  # 第二个参数是输出目录
    operation_type = sys.argv[3]  # 第三个参数是操作类型（to_markdown 或 to_word）

    # 检查操作类型是否有效
    if operation_type not in ['to_markdown', 'to_word']:
        print("Error: Invalid operation type. Must be 'to_markdown' or 'to_word'.")
        sys.exit(1)  # 如果操作类型无效，打印错误信息并退出程序[[2]]
    
    return input_dir, output_dir, operation_type  # 返回解析后的参数

def check_directory(directory):
    """
    检查给定的目录是否存在。
    """
    if not os.path.exists(directory):  # 使用os.path.exists检查目录是否存在[[2]]
        print(f"Error: Directory '{directory}' does not exist.")
        sys.exit(1)  # 如果目录不存在，打印错误信息并退出程序

def create_directory(directory):
    """
    如果目录不存在，则创建该目录。
    """
    if not os.path.exists(directory):  # 再次检查目录是否存在
        try:
            os.makedirs(directory)  # 使用os.makedirs创建目录（支持递归创建）
        except OSError as e:  # 捕获可能的异常（如权限问题）
            print(f"Error: Failed to create directory '{directory}'. {e}")
            sys.exit(1)  # 如果创建失败，打印错误信息并退出程序

def convert_file(input_file, output_file, operation_type):
    """
    根据操作类型转换文件。
    """
    # 根据操作类型构建Pandoc命令
    if operation_type == 'to_markdown':
        command = ['pandoc', input_file, '-o', output_file]  # 将Word文件转换为Markdown
    elif operation_type == 'to_word':
        command = ['pandoc', input_file, '-o', output_file, '-s', '--to=docx']  # 将Markdown文件转换为Word文档
    
    try:
        # 执行Pandoc命令
        result = subprocess.run(command, check=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE, text=True)
        # check=True会在命令失败时抛出异常，stdout和stderr捕获输出信息
    except subprocess.CalledProcessError as e:  # 捕获命令执行失败的异常
        print(f"Error: Conversion failed for file '{input_file}'. Exit status: {e.returncode}. Output: {e.stderr}")
        return False  # 如果转换失败，返回False表示操作未成功
    return True  # 如果转换成功，返回True

def main():
    """
    主函数，负责处理文件转换的逻辑。
    """
    # 检查命令行参数并获取输入目录、输出目录和操作类型
    input_dir, output_dir, operation_type = check_args()
    
    # 检查输入目录是否存在
    check_directory(input_dir)  # 确保输入目录存在
    # 创建输出目录（如果不存在）
    create_directory(output_dir)  # 确保输出目录存在
    
    # 遍历输入目录中的所有文件
    for filename in os.listdir(input_dir):  # 使用os.listdir列出目录中的所有文件
        input_file = os.path.join(input_dir, filename)  # 构建完整的文件路径
        if not os.path.isfile(input_file):  # 跳过非文件项（如子目录）
            continue
        
        # 根据操作类型过滤文件
        if operation_type == 'to_markdown' and not filename.endswith('.docx'):
            print(f"Warning: Skipping non-Word file '{filename}'.")  # 跳过非.docx文件
            continue
        elif operation_type == 'to_word' and not filename.endswith('.md'):
            print(f"Warning: Skipping non-Markdown file '{filename}'.")  # 跳过非.md文件
            continue
        
        # 构建输出文件路径
        output_file = os.path.join(output_dir, os.path.splitext(filename)[0] + 
                                   ('.md' if operation_type == 'to_markdown' else '.docx'))  # 修改文件扩展名
        
        # 调用convert_file进行文件转换
        if not convert_file(input_file, output_file, operation_type):  # 如果转换失败，跳过当前文件
            continue
        
        print(f"Converted '{input_file}' to '{output_file}'.")  # 打印成功转换的信息

if __name__ == "__main__":
    main()  # 当脚本作为主程序运行时，调用main函数

将上述代码保存为.py文件，确保已经正确安装python和pandoc的前提下：

在 Windows 系统中，可以通过以下步骤运行该脚本：
1.打开命令提示符
- 按 Win + R，输入 cmd 并回车，打开命令提示符。
2.导航到脚本所在目录
假设脚本保存为 script.py，位于 C:\Users\YourName\Desktop：
bash cd C:\Users\YourName\Desktop
3. 运行脚本并提供参数
输入以下命令运行脚本：

python script.py path/to/input/directory path/to/output/directory to_markdown

替换 path/to/input/directory 和 path/to/output/directory 为实际路径。
注意：Windows 路径中使用反斜杠（\），但在命令行中建议用双反斜杠（\）或正斜杠（/）避免转义问题

在MacOs或Linux中：
1.导航到脚本所在目录：

cd /path/to/script/directory

2.执行脚本并提供参数：

python3 script.py path/to/input/directory path/to/output/directory to_markdown

2.用 shell脚本和 Pandoc 进行批量转换（只能在MacOs和Linux系统运行）

以下是一个使用 shell 脚本结合 Pandoc 进行批量转换的示例代码：

#!/bin/bash

# 检查参数数量
if [ "$#" -ne 3 ]; then
    echo "Usage: $0 <input_directory> <output_directory> <to_markdown|to_word>"
    exit 1
fi

INPUT_DIRECTORY=$1
OUTPUT_DIRECTORY=$2
OPERATION=$3

# 检查操作类型是否有效
if [ "$OPERATION" != "to_markdown" ] && [ "$OPERATION" != "to_word" ]; then
    echo "Error: Invalid operation. Use 'to_markdown' or 'to_word'."
    exit 1
fi

# 检查输入目录是否存在
if [ ! -d "$INPUT_DIRECTORY" ]; then
    echo "Error: Input directory '$INPUT_DIRECTORY' does not exist."
    exit 1
fi

# 检查输出目录是否存在，不存在则创建
if [ ! -d "$OUTPUT_DIRECTORY" ]; then
    echo "Output directory '$OUTPUT_DIRECTORY' does not exist. Creating..."
    mkdir -p "$OUTPUT_DIRECTORY"
    if [ $? -ne 0 ]; then
        echo "Error: Failed to create output directory '$OUTPUT_DIRECTORY'."
        exit 1
    fi
fi

# 遍历输入目录下的所有文件
for FILE in "$INPUT_DIRECTORY"/*; do
    # 检查文件是否存在
    if [ ! -f "$FILE" ]; then
        echo "Warning: File '$FILE' does not exist. Skipping..."
        continue
    fi

    # 根据操作类型决定转换方向
    if [ "$OPERATION" == "to_markdown" ]; then
        # 检查文件是否为Word文档
        if [[ "$FILE" == *.docx ]]; then
            OUTPUT_FILE="$OUTPUT_DIRECTORY/${FILE##*/}.md"
            echo "Converting '$FILE' to '$OUTPUT_FILE'"
            pandoc "$FILE" -o "$OUTPUT_FILE"
            if [ $? -ne 0 ]; then
                echo "Error: Failed to convert '$FILE' to '$OUTPUT_FILE'. Pandoc may not be installed or there may be an issue with the file."
            fi
        else
            echo "Warning: '$FILE' is not a Word document. Skipping..."
        fi
    elif [ "$OPERATION" == "to_word" ]; then
        # 检查文件是否为Markdown文档
        if [[ "$FILE" == *.md ]]; then
            OUTPUT_FILE="$OUTPUT_DIRECTORY/${FILE##*/}.docx"
            echo "Converting '$FILE' to '$OUTPUT_FILE'"
            pandoc "$FILE" -o "$OUTPUT_FILE"
            if [ $? -ne 0 ]; then
                echo "Error: Failed to convert '$FILE' to '$OUTPUT_FILE'. Pandoc may not be installed or there may be an issue with the file."
            fi
        else
            echo "Warning: '$FILE' is not a Markdown document. Skipping..."
        fi
    fi
done

echo "Conversion completed."

使用方法

将上述代码保存为一个Shell脚本文件，例如markdown_word_converter.sh。
在代码编辑器或文本编辑器中保存，尽量不要先保存到txt文件再改后缀。
给脚本文件添加执行权限：

打开终端：
- macOS：用Command (⌘) + 空格键打开Spotlight，然后输入Terminal并按Enter键。或在Finder应用程序中的“应用程序”>“实用工具”找到并打开Terminal。
- Linux：大多数Linux发行版都支持使用Ctrl + Alt + T快捷键直接打开终端。或通过桌面环境的开始菜单或应用程序列表找到并打开终端。
MacOs和Linux系统在终端中运行：
```
chmod +x markdown_word_converter.sh
```

运行脚本，指定要转换的目录和操作类型（to_markdown或to_word）：

将Markdown转换为Word：

./markdown_word_converter_with_error_handling.sh /path/to/your/directory to_word

将Word转换为Markdown：

./markdown_word_converter_with_error_handling.sh /path/to/your/directory to_markdown

脚本说明

参数检查：
- 脚本首先检查是否提供了正确的参数数量（3个：输入目录、输出目录、操作类型）。
- 如果参数数量不正确，则输出使用说明并退出。
操作类型检查：
- 验证操作类型是否为to_markdown或to_word。
- 如果操作类型无效，则输出错误消息并退出。
输入目录检查：
- 检查输入目录是否存在。
- 如果输入目录不存在，则输出错误消息并退出。
输出目录检查与创建：
- 检查输出目录是否存在。
- 如果输出目录不存在，则尝试创建它。
- 如果创建输出目录失败，则输出错误消息并退出。
文件遍历：
- 遍历输入目录下的所有文件。
- 对于每个文件，检查它是否存在。
转换方向判断：
- 根据操作类型决定转换方向（Markdown到Word或Word到Markdown）。
- 检查文件是否为目标转换类型的文件（例如，在to_markdown操作中检查是否为Word文档）。
- 如果文件不是目标转换类型的文件，则输出警告并跳过。
转换操作与错误处理：
- 使用Pandoc进行文件转换。
- 检查Pandoc命令的退出状态。
- 如果退出状态不为0，则表示转换失败，并输出错误消息，提示可能的原因（如Pandoc未安装或文件有问题）。
非目标文件类型警告：
- 如果文件不是目标转换类型的文件，则输出警告并跳过。