PDF转可编辑的文字很难?PHP文字识别接口一键即可搞定

在我们日常的工作中,需要处理的文档、文件非常多,如果都靠手动输入和修改会非常的耽误时间和效率。以前,人们想把一本书的内容或打印出来的合同内容转化成可编辑文档,需要费时费力的靠人工输入,然后再纠正错字。所以几年前,网络上到处都是招聘文字录入专员的信息,但是现在很难再看到这种信息了。那是因为OCR识别技术的快速发展,将人们从这种重复性强、枯燥的工作中解救出来。

OCR识别从某种角度来说,可以理解为:机器(系统)认字,而原理和我们查字典的方法较为相似,也就是说,我们需要先给机器(系统)一本“字典”,这本字典常被称作“特征库”或“模板库”。机器(系统)识别文字时会把要识别的文字和字典中所有的标准字符逐一比较,接着会选取出跟待识字符相同或最相似的字符。

OCR文字识别通俗来讲,是指对文本资料进行扫描,然后对扫描文件进行分析处理,获取文字及版面信息的过程,也可以理解为是提供图片文字识别服务的一项技术。OCR技术现在还是比较成熟的,生活中或者是工作中都可以用得到,借助于OCR技术诞生的图片转文字、PDF转Word的工具有很多,比如翔云OCR云服务平台。

文档识别PHP语言为例:


<?php
class Sample {

	public function run() {
		$curl = curl_init();
		curl_setopt_array($curl, array(

			CURLOPT_URL => 'https://netocr.com/api/recogliu.do',
			CURLOPT_RETURNTRANSFER => true,
			CURLOPT_ENCODING => '',
			CURLOPT_MAXREDIRS => 10,
			CURLOPT_TIMEOUT => 0,
			CURLOPT_FOLLOWLOCATION => true,
			CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
			CURLOPT_CUSTOMREQUEST => 'POST',
			CURLOPT_POSTFIELDS => array('img' => '/9j','key' => 'M***********g','secret' => '3***********6','typeId' => '1993','format' => 'json'),

		));
		$response = curl_exec($curl);
        curl_close($curl);
        echo $response;
	}
}
$rtn = (new Sample())->run();
print_r($rtn);

能够合理的利用翔云在线文档识别服务,工作就会变得轻松、便捷。我们可以从书籍、文本中抽取信息,不需要人们重新打字输入,可以在线转换为可编辑的文字。除了PDF文档还可以是图片等格式,在翔云平台都可以识别。除了文档识别,翔云还提供证件识别、车牌识别、银行卡识别、名片识别、营业执照识别等服务。

  • 6
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值