from pdfminer.high_level import extract_text
defextract_pdf_text(pdf_file):
text = extract_text(pdf_file)print(text)# 使用方法
extract_pdf_text('example.pdf')
输出
案例2:详细解析并打印每一页内容
代码
from pdfminer.high_level import extract_pages
from pdfminer.layout import LTTextContainer
defparse_pages(pdf_file):for page_layout in extract_pages(pdf_file):for element in page_layout:ifisinstance(element, LTTextContainer):print(element.get_text())# 使用方法
parse_pages('example.pdf')