关于pdf的吐槽

agctXY

已于 2022-01-19 00:13:30 修改

阅读量397

点赞数

分类专栏：杂记文章标签：其他吐槽

于 2021-12-30 10:24:16 首次发布

本文链接：https://blog.csdn.net/agctXY/article/details/122230278

版权

杂记专栏收录该内容

69 篇文章

订阅专栏

关于pdf的吐槽

起因

最近在复习嵌入式,想要写一个简单的库,通过stm32向st7735驱动的tft发送图片,于是就开始看那个文档(比如这个连接,点击下载),然后里面有一行一行的那种命令表格.我就想要软件解析,脚本自动生成代码.

经过

在浏览器内复制文本之后,粘贴到记事本里面,然后开始操作,但是粘贴出来的格式就非常的乱,就需要有一次的人工处理,也就是说原先表格的数据在粘贴的过程中已经丢失了,然后我又开始找pdf转txt或者html之类的开源库或者是其它应用程序.然后找了一段时间,试了下pdfminer,效果真的不怎么样,表格好像没有导出来,还有一些在线转换的网站,也是一样,之后看到了pdfbox但是没有测试.最后,还是使用了Adobe Acrobat XI Pro才成功转换为html格式,即使这样有一些表格依然是结构混乱.