![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
图文识别
文章平均质量分 83
乔妹的船长
这个作者很懒,什么都没留下…
展开
-
JAVA base64图片数据和本地图片相互转换
本文采用Apache Commons Codec有提供Base64的编码与解码功能,会使用到org.apache.commons.codec.binary套件下的Base64类别,jar包名称:commons-codec-1.12.jar,用法如下:package com.baidu.api;import org.apache.commons.codec.binary.Base64;i...原创 2019-11-26 16:53:23 · 784 阅读 · 0 评论 -
模拟登录系列3-java模拟登录网站-验证码破解
需求:每日会在指定文件夹下生成一个excl文件,系统需要定时读取该文件,根据这个生成文件的数据去匹配填充指定excl模板数据,excl模板文件每天也需要从指定网站下载,并完成上传到指定网站;本文继上次百度开发者接口图文识别,来实现模拟登录网站;为后续自动化下载数据(爬虫),自动上传数据(数据自动报送)功能做准备。本文不在叙述百度开发者中心接口调用过程,如果有不懂可以查看我的前面文章;本文主要实...原创 2019-11-15 17:42:06 · 1447 阅读 · 0 评论 -
java解析pdf格式文件获取文本内容
思路:先将pdf按照页数分割成图片,在将分割的图片做图片识别,提取文字,最后将提取到的文字解析或者保存到txt文件。图片识别我使用的是百度开发者中心提供的图片识别接口,我在上一篇文章中有详细说明,这里直接跳过,文本只调用的百度开发者中的通用文字接口,对于pdf中的表格,图像,印章无法做到识别;但是在百度开发者中心已经提供了相关接口,可自行参考接口说明,百度开发中心的相关使用和介绍也上上一篇...原创 2019-11-05 18:47:03 · 3653 阅读 · 2 评论 -
模拟登录系列1- java调用百度开发者中心的图片文字识别接口
需求:每日会在指定文件夹下生成一个excl文件,系统需要定时读取该文件,根据这个生成文件的数据去匹配填充指定excl模板数据,excl模板文件每天也需要从指定网站下载,并完成上传到指定网站;源码附在博客中了,在顶部↑↑↑↑。首先你需要拥有百度开发者中心的账号,如果没有请注册:https://login.bce.baidu.com/?account=简单的填写相关资料即可;填写好了登录主...原创 2019-11-04 16:56:06 · 813 阅读 · 0 评论