文字和位置识别接口,图像和位置识别接口,识别文字及文字所在位置及宽度

文字和位置识别接口,图像和位置识别接口,识别文字及文字所在位置及宽度

  • 本文提供一个图像、文字识别的接口,能够识别中文、英文,同时能返回文字内容(按句)、文字位置、宽度、中心点等。
  • 本接口是收费的(1分钱1次调用,也可联系微信xujian_cq考虑包年包月使用
  • 请求必要的code可以通过搜索小程序“数字续坚”,在首页签到后取得
  • 接口内容不包含敏感信息,如有侵权,请联系作者删除。
  • 先看看效果:

在这里插入图片描述

1 接口功能

  • 本文提供一个图像、文字识别的接口,能够识别中文、英文,同时能返回文字内容(按句)、文字位置、宽度、中心点等。

2 接口用法

2.1 重要参数

  • 入参
序号项目说明
1接口地址https://www.xujian.tech/atlapi/ocr/rec/{code}
2请求方式GET
3请求参数1code用来识别用的code,在微信小程序“数字续坚”首页签到取得,不会变化
4请求参数2imageUrl文件url地址(识别程序会下载这个文件,识别完成后删除,文件格式限.jpg、.png)

- 重要说明:code不可变更,请注意保密

  • 出参标准格式
序号项目说明
1返回值格式JSONObject含code、data、msg
2返回值1code200为成功,其他表示失败
3返回值2msg成功(succeed.)、失败的文字描述
4返回值3dataJSONArray结果,包含定位信息内容

2.2 返回值

  • 返回一个数组,含多个识别到的内容
  • 受坐标系影响,图片的左下角为原点(0,0)
序号参数名类型说明
1textString识别到的文字
2x0Integer坐标x0,即左侧位置
3y0Integer坐标y0,即底部位置(因坐标系原因,(0,0)是左下角,注意)
4x1Integer坐标x0,即左侧位置
5y1Integer坐标x1,即右侧位置
6xInteger识别内容的中心点位置x
7yInteger识别内容的中心点位置y
8wInteger识别内容的宽度
9hInteger识别内容的高度

2.3 请求示例

# 下方地址中的code请到数字续坚小程序首页签到获取,不会变化,注意保密
post https://www.xujian.tech/atlapi/ocr/rec/${YourCodeForm数字续坚小程序}
  • Postman 请求示意:
    在这里插入图片描述

2.4 返回示例

{
    "code": 200,
    "msg": "succeed.",
    "data": [
        {
            "text": "文字识别1",
            "x0": 100,
            "y0": 62,
            "x1": 162,
            "y1": 36,
            "x": 131,
            "y": 49,
            "w": 62,
            "h": 26
        },
        {
            "text": "待识别文字2",
            "x0": 212,
            "y0": 114,
            "x1": 296,
            "y1": 88,
            "x": 254,
            "y": 101,
            "w": 84,
            "h": 26
        },
        {
            "text": "wechatxujian_cq",
            "x0": 113,
            "y0": 218,
            "x1": 239,
            "y1": 202,
            "x": 176,
            "y": 210,
            "w": 126,
            "h": 16
        },
        {
            "text": "Inenglis",
            "x0": 289,
            "y0": 229,
            "x1": 340,
            "y1": 213,
            "x": 314,
            "y": 221,
            "w": 51,
            "h": 16
        }
    ]
}

3 收费方式

  • 收费,1分钱1次
  • 本接口是收费的(1分钱1次调用,也可联系微信xujian_cq考虑包年包月使用

4 消费查询

  • 打开网站,登录后在“API服务-OCR识别”中可查看调用情况
  • 也可以在上方网站发现更多有趣的事情
// 地址
https://www.xujian.tech/monitor

更多API服务正在更新

  • 12
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
使用Python识别和提取图片中指定位置文字,并修改文件名为该文字,可以使用Pytesseract和OpenCV库来实现。下面是一个实现的步骤: 1. 首先,确保已经安装好了必要的库,包括pytesseract和opencv-python: ``` pip install pytesseract pip install opencv-python ``` 2. 导入所需的库: ```python import cv2 import pytesseract ``` 3. 定义一个函数来读取图像并提取指定位置文字: ```python def extract_text(image_path, x, y, width, height): # 读取图像 image = cv2.imread(image_path) # 根据指定位置提取感兴趣区域 roi = image[y:y+height, x:x+width] # 将ROI区域转换为灰度图像 gray = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY) # 使用pytesseract进行文字识别 text = pytesseract.image_to_string(gray, lang='eng') return text ``` 4. 使用上面定义的函数来提取指定位置文字: ```python image_path = 'image.jpg' x = 100 # 感兴趣区域的左上角x坐标 y = 200 # 感兴趣区域的左上角y坐标 width = 300 # 感兴趣区域的宽度 height = 150 # 感兴趣区域的高度 text = extract_text(image_path, x, y, width, height) ``` 5. 修改文件名为提取的文字: ```python import os os.rename(image_path, text + '.jpg') ``` 以上是使用Python识别提取图片中指定位置文字,并修改文件名为该文字的一个简单实现。但需要注意的是,图片质量和文字的清晰度会对识别结果产生影响,因此对于一些复杂的场景,可能需要进行额外的图像预处理来提高识别准确性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值