python3 pdf 转 txt

原创 2017年06月21日 09:23:21

平时用手机看书,很多都是pdf格式的,手机阅读器没办法重新排版,看着不舒服,索性自己些个小程序把PDF转换成txt,在此记录一下,欢迎大家赐教指正

代码很简单,直接贴出来吧

from pdfminer.pdfinterp import PDFResourceManager, process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from io import StringIO
from io import open


def readPDF(pdfFile):
    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    laparams = LAParams()
    device = TextConverter(rsrcmgr, retstr, laparams=laparams)

    process_pdf(rsrcmgr, device, pdfFile)
    device.close()

    content = retstr.getvalue()
    retstr.close()
    return content


def saveTxt(txt):
    with open("istxt.txt", "w") as f:
        f.write(txt)


txt = readPDF(open('ispdf.pdf', 'rb'))
saveTxt(txt)

使用的是python3,记得提前安装PDFminer3K。

pip install PDFminer3K

对于纯文本的转换还是不错的,如果是带有图片或者表格的PDF效果不是很理想

相关文章推荐

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载

分享一下自己写的Python 3的各种PDF文档【花了半年时间那】

这些文档花了我半年的时间去整理,由于是第一次进行整理,希望帮助后来者少走弯路,毕竟是第一次整理,哪些地方不到位,希望大家和我练习,我们一起把它做好,下面就直接给出下载地址了,都是免积分的下载奥,因此,...

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载

Python3基础(十二) 学习总结·附PDF

Python是一门强大的解释型、面向对象的高级程序设计语言,它优雅、简单、可移植、易扩展,可用于桌面应用、系统编程、数据库编程、网络编程、web开发、图像处理、人工智能、数学应用、文本处理等等。 在...

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载

用python从pdf中提取信息,转为txt或者html

主要用到了pdfminer这个库 原文地址: http://www.bkjia.com/Pythonjc/1073800.html 示例代码 # -*- coding: utf...

Python利器 PDFMiner python实现PDF转换TXT(附代码)

PDFMiner其特征有: 1、完全使用python编写。(适用于2.4或更新版本) 2、解析,分析,并转换成PDF文档。 3、PDF-1.7规范的支持。(几乎) 4、中日韩CJK语言和垂直书...

python3安装 使用 pdfminer3k python在线、本地读取PDF文件

pdfminer3k 在线、本地读取PDF文件pdfminer3k 在线本地读取PDF文件 上资源 上代码上资源官网pdfminer3k 下载pdfminer3k上代码就着注释看代码,是一件美差。#...
  • y515789
  • y515789
  • 2017年08月21日 10:43
  • 1449
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:python3 pdf 转 txt
举报原因:
原因补充:

(最多只允许输入30个字)