为了更深入的学习和了解PDF文档,计划利用pyqt5实现一个PDF文档解析工具,具体的功能如下:
(a)PDF转图片(已实现)
(b)图片转PDF(已实现)
(b)PDF文本提取(已实现)
(d)图片文本提取(已实现)
(e)PDF表格抽取及结构化解析(计划中)
主要实现技术:pymupdf + ocr
一、UI界面如下
为了更深入的学习和了解PDF文档,计划利用pyqt5实现一个PDF文档解析工具,具体的功能如下:
(a)PDF转图片(已实现)
(b)图片转PDF(已实现)
(b)PDF文本提取(已实现)
(d)图片文本提取(已实现)
(e)PDF表格抽取及结构化解析(计划中)
主要实现技术:pymupdf + ocr
一、UI界面如下