PPTAgent：中科院开源AI工具，自动将文档转化为高质量PPT

最新推荐文章于 2025-04-09 10:17:07 发布

江湖人称麻花滕

最新推荐文章于 2025-04-09 10:17:07 发布

阅读量4.7k

点赞数 9

文章标签：人工智能开源 powerpoint 知识图谱学习计算机视觉深度学习

本文链接：https://blog.csdn.net/m0_59235699/article/details/145143135

版权

🚀 快速阅读

功能：PPTAgent 支持从文档自动生成高质量演示文稿，涵盖大纲生成、幻灯片设计与内容评估。
技术：基于两阶段编辑方法，结合大型语言模型（LLM）实现智能分析与迭代优化。
应用：适用于教育、企业培训、市场营销等多个领域，提升演示文稿生成效率与质量。

正文（附运行示例）

PPTAgent 是什么

PPTagent-advanced

PPTAgent 是由中国科学院软件研究所中文信息处理实验室推出的创新框架，旨在通过模仿人类工作流程的两阶段编辑方法，从文档自动生成高质量的演示文稿。该框架通过分析参考演示文稿，提取结构模式和内容模式，并基于代码动作草拟大纲并生成幻灯片，确保内容的一致性和对齐。

PPTAgent 基于大型语言模型（LLM）的能力，将演示文稿生成过程分解为迭代的编辑工作流程，从而提高生成演示文稿的连贯性和适应性。此外，PPTAgent 还引入了 PPT Eval 评估框架，从内容、设计和连贯性三个维度全面评估生成的演示文稿质量，为未来的演示文稿生成研究提供宝贵的资源和见解。

PPTAgent 的主要功能

分析参考演示文稿：理解其结构模式和内容模式。
草拟大纲：基于分析结果，创建详细的演示文稿大纲。
生成幻灯片：基于代码动作，将大纲转化为具体的幻灯片内容，确保内容的一致性和对齐。
编辑和修正：提供反馈机制，对生成的幻灯片进行编辑和自我修正，提高生成文稿的质量。
综合评估：基于 PPT Eval 框架，从内容、设计和连贯性三个维度评估生成的演示文稿质量。

PPTAgent 的技术原理

第一阶段：演示文稿分析
幻灯片聚类：将幻灯片分为结构幻灯片和内容幻灯片，分别通过 LLM 和层次聚类方法进行分析。
模式提取：利用 LLM 的情境感知能力，提取多样化的内容模式，确保编辑的目的性。
第二阶段：演示文稿生成
大纲生成：指导 LLM 创建结构化大纲，结合文档内容和参考演示文稿的语义信息。
幻灯片生成：在大纲指导下，基于迭代编辑参考幻灯片生成新幻灯片，并通过 API 支持文本和视觉元素的编辑。

如何运行 PPTAgent

运行该项目一般需要以下几个步骤，确保你已经安装了 Node.js 和 npm（或 yarn）。以下是详细的步骤：

1. 安装 Node.js 和 npm（如未安装）

Vue 项目依赖于 Node.js 环境。如果你还没有安装 Node.js，可以访问 Node.js 官网下载并安装适合你操作系统的版本。npm 会随 Node.js 一起安装。

2. 克隆该项目到本地运行环境

git clone https://github.com/icip-cas/PPTAgent.git

3. 进入项目目录

进入到项目web_ui目录。例如：

cd PPTAgent/pptagent_ui

4. 安装依赖

在项目目录下运行以下命令来安装项目所需的依赖包：

npm install   # 或者使用 yarn   # yarn install

5. 运行开发服务器

安装完依赖后，你可以通过以下命令启动开发服务器：

npm run serve   # 或者使用 yarn   # yarn serve

这将启动一个本地开发服务器，默认情况下会在 http://localhost:8080 提供项目。你可以通过浏览器访问这个地址来查看你的 Vue 应用。

如何使用 PPTAgent 评估生成的 PPT

1. 安装依赖

pip install -r requirements.txt   sudo apt install libreoffice   sudo apt install poppler-utils

2. 生成演示文稿

python rebuild.py rebuild_all --out_filename "final.pptx"

3. 将 PPT 转换为图片

python evals.py pptx2images

4. 评估演示文稿

python evals.py eval_experiment -s 0 -j 0

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述