- 博客(1)
- 收藏
- 关注
原创 pdfminer提取文献pdf图片以及图片标题
我的能力有限,以图片坐标定位图片标题的做法,很容易将错误的内容(如图片左边,上方的文字)认为是标题,所以采用遍历所有文字,提取以Fig. 为起始的段落,而本方法段落的定义就是以两个换行符结尾(如果以一个换行符为结尾会导致内容不完整)。pic_output_folder ='输出/Visualization_and_Computer_Graphics_IEEE_Transactions_on_-_Volume_27_-_Issue_'+str(i)+'/文献的图片' # 图片将被保存在这个文件夹中。
2024-09-26 11:54:41
1493
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅