图片中的文字识别算是人工智能中的一个很常见的需求。当然我们可以自己建立和训练模型来实现文字识别,但是如果有现成的工具,而且还是由Baidu这么一个站在人工智能前沿的巨头开发出的工具(没错,指的就是AI开放平台了),那为什么不用呢?除非是要搞自主知识产权,避免后续产品研发中的商业纠纷,那么作为个人制作一些有用的工具来说,是非常之方便和可信赖的。
本篇博客就简单介绍一下利用百度AI开放平台 实现 图片中的文字识别(当然官方文档中也有相当详细的指引)
一、百度AI开放平台介绍
1. 百度AI开放平台网址为:http://ai.baidu.com/
点击开发资源,可以找到对应AI功能板块的文档和SDK下载
SDK 支持多种语言和开发平台,平台方面包括android和ios,语言方面包括Java,PHP,Python,C++,C#等多种语言。
2. 基本要求
a. 注册百度云用户
b. 使用时需要联网
二、文字识别SDK(本文以Python语言为使用范例)
1. 点击下载文字识别对应的Python SDK文件压缩包,并解压。(无需分python2 或python3,通用支持)
2. 文件夹下会有aip、bin文件夹,以及LICENSE无格式文件,setup.py
3. 安装:如果已安装pip, 执行 pip install baidu-aip 即可,如果已安装setuptool