从0到1：构建一个智能PDF摘要工具，提升工作效率的终极利器_搭建一个本地阅读文档写文档摘要的应用-CSDN博客

本文链接：https://blog.csdn.net/qq_36224726/article/details/141395852

在当今快节奏的信息社会中，效率就是一切。无论是学生、研究人员，还是忙碌的专业人士，我们每天都需要处理大量的PDF文档。如何快速提取文档中的核心信息，成为了提升工作效率的关键。然而，市面上许多工具要么价格高昂，要么功能过于复杂。本篇文章将带你一步步构建一个简单实用的智能PDF摘要工具，不仅能快速生成文档摘要，还具备直观且美观的用户界面，让你轻松应对繁杂的文档工作。

效果图：

1. 项目概述

在这个项目中，我们将使用Python和PyQt5库构建一个桌面应用程序。该工具旨在为用户提供一种快速生成PDF文档摘要的方法，结合了OpenAI的GPT模型强大语言处理能力，以及简洁优雅的用户界面设计。本文将详细讲解代码的各个模块，从界面布局、样式设计到核心功能的实现，帮助你快速掌握如何创建一个实用的桌面应用。

2. 环境准备与依赖安装

首先，我们需要确保Python环境中安装了以下依赖：

openai：用于与OpenAI的API交互，生成文本摘要。
PyMuPDF (fitz)：用于从PDF文件中提取文本内容。
PyQt5：用于构建图形用户界面 (GUI)。

可以通过以下命令安装所需库：

pip install openai PyMuPDF PyQt5

3. 用户界面设计与实现

3.1 创建主窗口与布局

我们的应用主窗口包含文件选择按钮、摘要长度选择下拉框、文本显示框以及生成和保存摘要的按钮。为了使界面紧凑美观，我们选择使用QVBoxLayout和QHBoxLayout布局，合理地组织各个控件的位置。

def initUI(self):
    self.setWindowTitle('Document Summary Tool')
    self.setGeometry(100, 100, 600, 450)  # 增加窗口尺寸

    layout = QVBoxLayout()
    layout.setSpacing(15)  # 设置控件之间的间距
    # 界面布局代码...
    self.setLayout(layout)

3.2 美化界面元素

为了提高用户体验，我们通过QSS（Qt样式表）为界面元素设置了自定义样式。这不仅包括了按钮的颜色和形状，还对下拉框、标签和文本框的样式进行了统一设计，确保整个应用的外观现代而一致。

def apply_styles(self):
    button_style = """
        QPushButton {
            background-color: #4CAF50;
            color: white;
            font-size: 14px;
            border-radius: 5px;
        }
        QPushButton:hover {
            background-color: #45a049;
        }
    """
    self.select_file_btn.setStyleSheet(button_style)
    self.generate_summary_btn.setStyleSheet(button_style)
    self.save_summary_btn.setStyleSheet(button_style)

    label_style = """
        QLabel {
            font-size: 16px;
            font-weight: bold;
            color: #333333;
        }
    """
    self.file_label.setStyleSheet(label_style)
    self.length_label.setStyleSheet(label_style)
    
    combo_style = """
        QComboBox {
            font-size: 14px;
            padding: 5px;
            border: 1px solid #ccc;
            border-radius: 5px;
            background-color: #ffffff;
        }
        QComboBox QAbstractItemView {
            border: 1px solid #ccc;
            selection-background-color: #4CAF50;
        }
    """
    self.summary_length_combo.setStyleSheet(combo_style)

4. 核心功能实现

4.1 PDF文档文本提取

通过PyMuPDF库，我们能够从用户选择的PDF文档中提取文本内容。此步骤为生成摘要提供了基础数据。

def extract_text_from_pdf(self, pdf_path):
    with fitz.open(pdf_path) as doc:
        text = ""
        for page in doc:
            text += page.get_text()
    return text

4.2 调用OpenAI生成文档摘要

使用OpenAI的API，我们可以生成不同长度的文档摘要。用户可以根据需要选择生成简短、标准或详细的摘要。

def generate_summary(self):
    pdf_text = self.extract_text_from_pdf(self.file_path)
    summary_length = self.summary_length_combo.currentText()
    if summary_length == '简短':
        prompt = f"请总结以下内容的简短版本:\n\n{pdf_text}"
    elif summary_length == '详细':
        prompt = f"请详细总结以下内容:\n\n{pdf_text}"
    else:
        prompt = f"请总结以下内容:\n\n{pdf_text}"

    response = openai.ChatCompletion.create(
        model="gpt-4",
        messages=[
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": prompt}
        ]
    )
    summary = response['choices'][0]['message']['content']
    self.summary_text.setPlainText(summary)