自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 10行Python代码批量实现pdf转txt,word,提取表格到excel

在日常工作中,常常要把文档转格式,比如常见pdf转word,pdf转ppt等,如果数量少的话还好,可以直接去网上找网站解决,多了的话就比较麻烦了,因为很多网站都是限制一天只能转几个,再多就得冲vip。那么用python脚本来说应该怎么办呢?办法非常简单,几行代码就可以搞定。python有专门针对PDF,word,txt,ppt,excel 的包。我们今天就试着把pdf分别转为这四种格式。先来看怎么把pdf 转为txt,这里说一个前提,pdf是可以编辑的,如果是影印的可以先转为图片然后再文字识

2022-02-16 17:34:26 1867

原创 Python教程:利用百度API进行批量图片OCR识别

我最近有个需求,就是想把一批图片分别进行文字识别,网上的很多工具很多只能一张张识别,而且准确率还大打折扣。这次利用python来开发一段脚本,最终的成果是这样的。注意:text.doc 是新生成的首先需要你需要把你的文件存在一个文件夹里,然后用os模块下的listdir方法来找到里边的文件,然后用一个for循环结合with open 方法打开并读取所有需要的文件,我存放在了桌面上C:\Users\itcast\Desktop\ocr代码如下:import osdirs = o

2022-02-15 19:30:00 3686

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除