基于minerU的DynaMyTranslate文献翻译工具

PDF文献翻译助手

这是一个基于 MinerU 开发的文献翻译工具,可以将英文PDF文献转换为中文Markdown格式,帮助研究人员更高效地阅读和理解英文文献。

功能特色

  • 📄 智能文档解析 - 基于MinerU技术,精准识别PDF文档结构,保持原文排版格式
  • 🔤 高精度提取 - 准确提取文本内容,完美支持数学公式和特殊字符
  • 📊 复杂元素识别 - 精准处理表格、图片、公式等复杂元素
  • 🌐 专业翻译 - 基于DeepSeek API的高质量中文翻译,保持学术术语准确性
  • 📝 Markdown输出 - 标准Markdown格式输出,完美适配Obsidian等笔记软件
  • 🎯 批量处理 - 支持同时处理多个PDF文件
  • 💻 现代化界面 - 基于Next.js的美观Web界面
  • 🔌 分离式架构 - 前后端分离,支持分布式部署

项目github地址DynaMyTranslate

效果示例

公式

在这里插入图片描述


图片

在这里插入图片描述


网站

在这里插入图片描述


环境要求

  • 操作系统:Windows 10/11、Linux、macOS
  • Python 3.10 或更高版本
  • Node.js 18.0 或更高版本
  • npm 或 pnpm 包管理器
  • DeepSeek API Key(用于翻译服务)

安装步骤

1. 安装基础环境

  1. 安装 Python 环境

    # 安装 Miniconda(推荐)
    wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Windows-x86_64.exe
    # 或访问 https://docs.conda.io/projects/miniconda/en/latest/ 下载安装
    
    # 创建虚拟环境
    conda create -n translate python=3.10
    conda activate translate
    
  2. 安装 Node.js 环境

    • 访问 Node.js官网 下载并安装 LTS 版本
    • 验证安装:node --versionnpm --version

2. 安装项目

  1. 安装 MinerU

  2. 克隆项目

    git clone [项目地址]
    cd translate
    
  3. 安装依赖

    # 安装后端依赖
    cd server
    pip install -r requirements.txt
    
    # 安装前端依赖
    cd ../front
    npm install   # 或使用 pnpm install
    

3. 配置环境变量

  1. 获取 DeepSeek API Key

  2. 设置环境变量

    .env 文件:

    DEEPSEEK_API_KEY=your_api_key_here
    

运行说明

Windows系统

  1. 配置启动文件

    • 打开 start.bat 文件
    • 修改 Python 环境路径为你的实际路径,例如:
      # 修改这一行中的Python路径
      start "Flask Backend" cmd /k "cd server && "D:\myenvs\translate\python.exe" app.py"
      
    • 路径通常在 Anaconda 安装目录下的 envs\translate\python.exe
  2. 直接运行(推荐)

    • 双击运行 start.bat
    • 等待前端和后端服务启动完成
  3. 手动运行

    # 终端1:启动前端
    cd front
    npm run start   # 或 pnpm start
    
    # 终端2:启动后端
    cd server
    python app.py
    

Linux/macOS系统

  1. 创建启动脚本

    # 创建并设置权限
    touch start.sh
    chmod +x start.sh
    
  2. 编辑 start.sh

    #!/bin/bash
    # 启动前端
    cd front && npm run start &
    # 启动后端
    cd server && python app.py
    
  3. 运行服务

    ./start.sh
    

访问应用

  • 前端界面:http://localhost:3000

使用说明

  1. 打开浏览器访问 http://localhost:3000
  2. 注册/登录账号
  3. 在翻译页面:
    • 点击"选择文件"上传PDF文件
    • 或拖拽文件到上传区域
  4. 等待处理完成,下载翻译结果
03-08
### 关于MinerU的技术信息 MinerU是一个一站式的开源高质量数据提取工具,支持PDF、网页以及多格式电子书等多种形式的数据源中的内容抽取工作[^2]。对于希望从不同类型的文件或者在线资源里高效获取有用资料的研究人员或是开发者来说非常实用。 #### 获取途径 - **官方网站**: 可访问[MinerU官网](https://mineru.net/)了解更多信息并下载软件。 - **GitHub仓库**: [MinerU GitHub页面](https://github.com/opendatalab/MinerU)提供了完整的项目代码和开发文档,方便有兴趣深入了解或参与到这个项目的个人查阅。 - **线上演示环境**: 如果想要先体验一下MinerU的功能而不必立即安装本地版本,则可以尝试进入[线上Demo入口](https://mineru.net/OpenSourceTools/Extractor)[^1]。 #### Docker启动指南 为了便于部署和服务运行,在Docker容器中启动MinerU服务的方法如下所示: ```bash docker run -itd --name=mineru_server --gpus=all -p 8888:8000 quincyqiang/mineru:0.2-models ``` 这条命令会创建一个新的名为`mineru_server`的Docker实例,并将其内部端口映射到主机上的指定端口(这里默认为8888),同时分配所有的GPU给此容器使用以便加速某些计算密集型任务。需要注意的是,这里的端口号可以根据实际情况灵活调整[^5]。 #### 功能特性概述 作为一款专注于提升用户体验的产品,MinerU不仅限于基本的文字识别与结构化转换能力;更重要的是其具备高度灵活性——由于采用了开放源码的形式发布,任何人均可根据特定应用场景的需求对其进行个性化修改和发展,从而更好地服务于不同的业务流程。此外,这种模式也鼓励了更多人的加入和技术交流活动的发生,共同推动着整个生态系统的进步与发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值