【Python】使用pdfplumber 读取dpf文本与图片

最新推荐文章于 2025-04-07 13:24:18 发布

果壳~

最新推荐文章于 2025-04-07 13:24:18 发布

阅读量4.2k

点赞数 1

文章标签： python

本文链接：https://blog.csdn.net/Passer_hua/article/details/126301392

版权

with pdfplumber.open('./1.pdf') as pdf:
	# 获取第一页
	first_page = pdf.pages[1]
	print('页码：', first_page.page_number)
	print('页宽：', first_page.width)
	print('页高：', first_page.height)
	# 获取第一页文本
	text = first_page.extract_text()
    print(text)
	
	# 获取第一页图片,获取到的是一个列表,列表中存储的是字典
	imgs = first_page.images
	i = 0
	for img in imgs:
		# 获取图片的二进制流
		print(img['stream'].get_data())
		with open(f'./{i}.png', mode='wb')
			f2.write(img['stream'].get_data())