一、前言
智能图像处理、文字表格识别、文档内容提取产品的背景源自于人工智能技术的快速发展和广泛应用。随着计算机视觉和自然语言处理技术的不断进步,人工智能在图像处理和文字识别领域取得了巨大的突破,使得这些产品能够实现更加精准和高效的功能。
本次我们使用了TextIn产品的通用文字识别API服务,最直观的感受是识别准确率之高,识别功能之强大,调用之迅速便捷。同时,咨询客服处理问题也很准确和高效,网站提供的教程和相关代码很完善,为用户提供了全方面,贴心高效的服务。
二、API使用
Textin的API使用十分方便,按照下面操作步骤即可:
1.注册账号,点击工作台
2.在“我的机器人”中选择公有云API,点击“获取机器人”,选择需要的服务
3.以“图片切边增强”为例,我们可以选择申请免费的1000次额度用于测试
4.你可以在公有云API页面找到申请的机器人,可选择“在线使用”来试用功能
5.API的使用,以图像切边增强python代码为例:
- 选择API集成,然后选择API调试,可以查看API文档和示例代码
- 阅读API文档,所需URL、请求说明、URL参数等
- 仿照示例代码,运行测试
def enhance_images(img_path, enhance_img_path): # 设置API端点 url = "https://api.textin.com/ai/service/v1/crop_enhance_image?enhance_mode=2&correct_direction=1&crop_scene=0" # 设置请求头 headers = { "x-ti-app-id": "7ca85f685ad1cb5bdbf03c8dc86c49ba", "x-ti-secret-code": "f309678e839185159c018b7ec966****", # 这部分自己在该页面上可以找到噢 } # 定义处理单张图片的函数 def process_image(image_path): with open(image_path, 'rb') as image_file: # 读取图片内容 image_data = image_file.read() response = requests.post(url, headers=headers, data=image_data) if response.status_code == 200: # 获取响应中的增强图片数据 enhanced_image_data = response.json()['result']['image_list'][0]['image'] # 将Base64编码的图片数据解码并保存到文件 enhanced_image_path = os.path.join(enhance_img_path, os.path.basename(image_path)) with open(enhanced_image_path, "wb") as file_to_save: file_to_save.write(base64.b64decode(enhanced_image_data)) print(f"Enhanced image saved as {enhanced_image_path}") else: print(f"Error occurred for {image_path}:", response.text) for filename in os.listdir('img'): if filename.lower().endswith(('.jpg', '.jpeg', '.png')): image_path = os.path.join('img', filename) process_image(image_path)
- 测试效果如下:
6.调试
如果发现报错,可根据API文档上的错误码说明与报错信息对比进行调整:
7.在线服务
使用过程中如遇到问题,还可咨询在线服务