PDF转TXT ChatGPT编程_gpt pdf 2 text-CSDN博客

本文链接：https://blog.csdn.net/PLANTTHESON/article/details/137690442

文章讲述了如何利用Python和ChatGPT的功能，通过编程将PDF文件转换为TXT格式，特别关注了如何处理PDF中的换行符和识别中文句号，以提供更好的阅读体验。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.目的

在Z-library找到一本书，只不过是PDF格式的，看的时候体验不好，还没有办法保存记录，就想着能不能转成txt格式放到手机自带的小说软件中看。
不想去网上找相关的软件，可以还需要付钱，所以尝试用ChatGPT来实现。

2.ChatGPT编程

提示词1：

我现在有一本书，格式是PDF的，需要把它转成TXT格式的，用python实现

生成代码

import PyPDF2

# 打开PDF文件
pdf_file = open('noteacher.pdf', 'rb')

# 创建一个PDF文件阅读器对象
pdf_reader = PyPDF2.PdfReader(pdf_file)

# 创建一个空字符串来存储文本内容
text = ''

# 遍历PDF页面并提取文本
for page_num in range(len(pdf_reader.pages)):
    page = pdf_reader.pages[page_num]
    text += page.extract_text()

# 关闭PDF文件
pdf_file.close()

# 将提取的文本内容写入TXT文件
with open('output_text_file.txt', 'w', encoding='utf-8') as txt_file:
    txt_file.write(text)