Paper2Poster 开源项目最佳实践教程

最新推荐文章于 2025-06-03 15:59:25 发布

穆花钥Norma

最新推荐文章于 2025-06-03 15:59:25 发布

阅读量431

点赞数 5

本文链接：https://blog.csdn.net/gitblog_00981/article/details/148296826

版权

Paper2Poster 开源项目最佳实践教程

Paper2Poster Open-source Multi-agent Poster Generation from Papers 项目地址: https://gitcode.com/gh_mirrors/pa/Paper2Poster

1. 项目介绍

Paper2Poster 是一个开源的多智能体海报生成系统，它能够从学术论文自动生成多媒体海报。该系统利用了自然语言处理和计算机视觉技术，通过智能体之间的交互，将论文内容转化为视觉化的海报形式。这一工具对于学术交流、会议展示以及教育推广等方面具有广泛的应用前景。

2. 项目快速启动

以下是快速启动 Paper2Poster 项目的步骤：

首先，确保你的开发环境已经安装了 Python。然后，按照以下步骤操作：

# 克隆项目到本地
git clone https://github.com/Paper2Poster/Paper2Poster.git

# 进入项目目录
cd Paper2Poster

# 安装项目依赖
pip install -r requirements.txt

# 创建 .env 文件并添加 OpenAI API key
# 注意替换 <your_openai_api_key> 为你的 OpenAI API 密钥
echo "OPENAI_API_KEY=<your_openai_api_key>" > .env

# 生成海报的示例命令（以下命令任选其一）

# 使用 GPT-4o 模型
python -m PosterAgent.new_pipeline \
  --poster_path="{dataset_dir}/{paper_name}/paper.pdf" \
  --model_name_t="4o" \
  --model_name_v="4o" \
  --poster_width_inches=48 \
  --poster_height_inches=36

# 使用 Qwen-2.5-7B-Instruct 和 GPT-4o 模型
python -m PosterAgent.new_pipeline \
  --poster_path="{dataset_dir}/{paper_name}/paper.pdf" \
  --model_name_t="vllm_qwen" \
  --model_name_v="4o" \
  --poster_width_inches=48 \
  --poster_height_inches=36

# 使用本地 Qwen-2.5-7B-Instruct 模型
python -m PosterAgent.new_pipeline \
  --poster_path="{dataset_dir}/{paper_name}/paper.pdf" \
  --model_name_t="vllm_qwen" \
  --model_name_v="vllm_qwen_vl" \
  --poster_width_inches=48 \
  --poster_height_inches=36

# 使用 o3 模型
python -m PosterAgent.new_pipeline \
  --poster_path="{dataset_dir}/{paper_name}/paper.pdf" \
  --model_name_t="o3" \
  --model_name_v="o3" \
  --poster_width_inches=48 \
  --poster_height_inches=36

确保将 {dataset_dir} 和 {paper_name} 替换为实际的目录和文件名。