自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 pdfminer提取文献pdf图片以及图片标题

我的能力有限,以图片坐标定位图片标题的做法,很容易将错误的内容(如图片左边,上方的文字)认为是标题,所以采用遍历所有文字,提取以Fig. 为起始的段落,而本方法段落的定义就是以两个换行符结尾(如果以一个换行符为结尾会导致内容不完整)。pic_output_folder ='输出/Visualization_and_Computer_Graphics_IEEE_Transactions_on_-_Volume_27_-_Issue_'+str(i)+'/文献的图片' # 图片将被保存在这个文件夹中。

2024-09-26 11:54:41 1493 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除