免费OCR图像识别文字识别API
一、OCR图像识别文字识别
光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。
自然场景文本识别的难度极高,原因包括:图片背景极为丰富,经常面临低亮度、低对比度、光照不均、透视变形和残缺遮挡等问题,而且文本的布局可能存在扭曲、褶皱、换向等问题,其中的文字也可能字体多样、字号字重颜色不一的问题。
二、使用步骤
1、接口
重要提示:建议使用https协议,当https协议无法使用时再尝试使用http协议
请求方式: POST
https://luckycola.com.cn/aiTools/imgOcr
2、请求参数
重要提醒⚠️:该接口请求参数是multipart/form-data格式⚠️
序号 | 参数 | 是否必须 | 说明 |
---|---|---|---|
1 | ColaKey | 是 | 唯一验证ColaKey, 可前往官网获取(http(s): //luckycola.com.cn) |
2 | file | 是 | 需要鉴别的图片资源(png、jpg、jpeg格式),注意:该接口请求参数是multipart/form-data格式 |
3 | lang | 否 | 当前检测的图片的内容是中文还是英文,如果是中文该参数值不传即可, 如果是英文传入“eng“,务必正确设置该值 |
注意!!!: 如果您还没有ColaKey,请先请前往官网个人中心获取
官网地址:http(s): //luckycola.com.cn/
3、请求参数示例
重要提醒⚠️:该接口请求参数是multipart/form-data格式⚠️
4、接口 返回示例
{
// 接口返回成功
"code": 0,
// 接口返回提示
"msg": "OCR识别成功",
"data": {
// 图片OCR识别出来的文本内容
"text": "LC 官 网 部 分 、AI 聊 天 接 口"
}
}
三、支持在线图片OCR识别
如果需要对在线图片进行OCR识别请使用下面这个API
1、使用方式
请求方式: GET
https://luckycola.com.cn/tools/urlocr?ColaKey=你的ColaKey&imgurl=在线图片地址&language=语言类型(eng或chs)
2、参数说明
序号 | 参数 | 是否必须 | 说明 |
---|---|---|---|
1 | ColaKey | 是 | 唯一验证ColaKey, 可前往官网获取(http(s): //luckycola.com.cn) |
2 | imgurl | 是 | 在线图片url地址,图片大小不超过1M |
3 | language | 否 | 检测的语言类型,中文(chs)或英文(eng),不传默认是中文 |
3、请求例子
https://luckycola.com.cn/tools/urlocr?ColaKey=你的ColaKey&imgurl=在线图片地址&language=chs
4、响应例子
{
"code": 0,
"msg": "ocr识别成功",
"data": {
"ParsedResults": [
{
"TextOverlay": {
"Lines": [],
"HasOverlay": false,
"Message": "Text overlay is not provided as it is not requested"
},
"TextOrientation": "0",
"FileParseExitCode": 1,
// 这是图片识别的结果内容
"ParsedText": "除了功能齐全的“POST℃CRAPI之外/parse/image,我们还/parse/ImageUrl为GET请求提供了一\r\n",
"ErrorMessage": "",
"ErrorDetails": ""
}
],
"OCRExitCode": 1,
"IsErroredOnProcessing": false,
"ProcessingTimeInMilliseconds": "4546",
"SearchablePDFURL": "Searchable PDF not generated as it was not requested."
}
}
四、温馨提示
注意以下几点,可以大大提高OCR内容识别的准确性
- 被识别图片尽量清晰容易被识别
- 被识别图片尽量中的内容尽量集中
- 被识别图片尽量中的内容尽量只包含一张语言且api参数正确传入lang对应的值