TexiIn简介:
上海合合信息科技股份有限公司是一家人工智能及大数据科技企业,专注于智能文字识别、图像处理、自然语言处理(NLP)、知识图谱、大数据挖掘等技术。基于自主研发的智能文字识别及商业大数据核心技术,为全球C端用户和多元行业B端客户提供数字化、智能化的产品及服务。
总而言之呢就是一款非常好用的人工智能付费API。
TextIn API 调用
接下来以通用文字识别API调用为例,语言为Python
- 首先进入TextIn官网合合TextIn - 合合信息旗下OCR云服务产品。
- 然后该注册就注册,该登录登录。
- 在登陆后去工作台中找到自己的“开发者信息”,记住自己x-ti-app-id和x-ti-secret-code。
- 之后找到自己想用的产品,如果只是想要在线使用则直接点击”在线使用“就可以。
- 如果想在自己项目里使用,需要开通购买(价格都还是很划算的)。
- 购买后,话不多说直接上代码。
import requests
import json
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
class CommonOcr(object):
def __init__(self, img_path):
# 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-app-id
# 示例代码中 x-ti-app-id 非真实数据
self._app_id = 'c81f*************************e9ff'
# 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-secret-code
# 示例代码中 x-ti-secret-code 非真实数据
self._secret_code = '5508***********************1c17'
self._img_path = img_path
def recognize(self):
# 通用文字识别
url = 'https://api.textin.com/ai/service/v2/recognize'
head = {}
try:
image = get_file_content(self._img_path)
head['x-ti-app-id'] = self._app_id
head['x-ti-secret-code'] = self._secret_code
result = requests.post(url, data=image, headers=head)
return result.text
except Exception as e:
return e
if __name__ == "__main__":
response = CommonOcr(r'example.jpg')
print(response.recognize())
只需要将相应位置的信息换成自己的就行。
TextIn - API中心 - 通用文字识别附上它的文档说明。
其中需要注意的是
请求体说明(Request Body)
Content-Type: application/octet-stream
要上传的图片,目前支持jpg, png, bmp, pdf, tiff, 单帧gif等大部分格式.
请注意,请求体的数据格式为文件的二进制流,非 FormData 或其他格式。文件大小不超过 10M,图像宽高须介于 20 和 10000(像素)之间。