存档日期:2018年2月26日 | 首次发布:2015年2月11日
了解如何构建REST应用程序,该应用程序提供用于使用IBM Bluemix将PDF文档转换为文本的Web服务。 该服务接受PDF文件; 将PDF文件转换为文本文件,以捕获文档中已标识的表(即XML或HTML); 并将结果返回给用户。 XML版本是OCR引擎的输出,而HTML版本是纠错过程的结果,该过程纠正了OCR引擎标识的表结构中的错误。
此内容不再被更新或维护。 全文以PDF格式“按原样”提供。 随着技术的飞速发展,某些内容,步骤或插图可能已更改。
翻译自: https://www.ibm.com/developerworks/web/library/wa-ocrextract-app/index.html