在学术研究和科学交流中,语言障碍常常是一个不容忽视的问题。PDFMathTranslate是一款专为解决这一问题而设计的PDF科学论文翻译和双语对比工具。它不仅能够保留原文的排版,还支持全文双语翻译,并且兼容多种翻译服务,极大地方便了科研人员和学生的工作。
核心特性
- 保留公式和图表:PDFMathTranslate能够完整保留PDF文档中的公式和图表,确保翻译后的文档信息完整。
- 保留可索引目录:工具能够保留原文的目录结构,便于用户快速定位文档内容。
- 支持多种翻译服务:兼容Google、DeepL、Ollama、OpenAI等多种翻译服务,用户可以根据需要选择合适的翻译引擎。
安装与使用
安装
PDFMathTranslate的安装非常简单,只需要确保Python版本不超过3.12,然后通过pip安装pdf2zh即可:
bash
pip install pdf2zh
使用
在命令行中执行翻译指令,PDFMathTranslate会在工作目录下生成翻译文档和双语对照文档。以下是一些基本的使用方法:
-
翻译完整文档:
bash
pdf2zh example.pdf
-
翻译部分文档:
bash
pdf2zh example.pdf -p 1-3,5
-
使用指定语言翻译:
bash
pdf2zh example.pdf -li en -lo ja
翻译服务配置
PDFMathTranslate支持多种翻译服务,用户可以根据需求进行配置:
-
使用DeepL/DeepLX翻译: 设置环境变量构建接入点,例如:
bash
export DEEPL_SERVER_URL=https://api.deepl.com export DEEPL_AUTH_KEY=xxx
然后执行翻译命令:
bash
pdf2zh example.pdf -s deepl
-
使用Ollama翻译: 设置环境变量构建接入点,例如:
bash
export OLLAMA_HOST=https://localhost:11434
然后执行翻译命令:
bash
pdf2zh example.pdf -s ollama:gemma2
-
使用OpenAI/SiliconCloud翻译: 设置环境变量构建接入点,例如:
bash
export OPENAI_BASE_URL=https://api.openai.com/v1 export OPENAI_API_KEY=xxx
然后执行翻译命令:
bash
pdf2zh example.pdf -s openai:gpt-4o
保留特定样式
PDFMathTranslate还允许用户使用正则表达式指定需要保留样式的字体和字符,例如:
bash
pdf2zh example.pdf -f "(CM[^RT].*|MS.*|.*Ital)" -c "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"
结论
PDFMathTranslate是一款功能强大的PDF文档翻译及双语对照工具,它通过保留原文排版和支持多种翻译服务,为用户提供了一个高效、便捷的翻译解决方案。无论是学术研究还是日常学习,PDFMathTranslate都能帮助用户跨越语言障碍,更高效地获取和分享知识。GitHub仓库地址为:Byaidu/PDFMathTranslate,用户可以访问该仓库了解更多详情和下载工具。