K210图像检测&(1~8)数字卡片识别

前言

  第一次使用该平台。想先找一个简单的识别,来走走流程。就想到了,前几年的送药小车的数字卡片识别。花了半天收集标记图片。在运行时要注意摄像头与数字卡片的高度。不过也有些不足,可能是收集某个数字的训练集的时候,拍摄高度,不一致(因为是手拍),导致最终在同一高度下有个别数字,的识别可能低一点。

  基于K210Bit开发板,MaixHub: AI 训练和分享平台和MaixPy IDE软件编译。网址: AI 训练和分享平台:https://maixhub.com/

具体参数文章介绍:https://maixhub.com/model/zoo/218

工程

链接:https://pan.baidu.com/s/1afhE_IAwn87fW_VEDrft4g  提取码:lypg

模型压缩包文件:1.main.py 2.model-54796.kmodel 3.report.json

三个文件夹,全丢SD卡里,在插上K210Bit,上电就能自动执行了。

代码

  因为我的板子屏幕要的屏幕要转动,完成串口发送和标签重命名,因为我之前的标签命名时以数字1之类来命名,但是在实际显示时汉字显示不出来就要重命名。为此我在原有的main.py的代码下增加下述修改。

原代码main.py

# generated by maixhub, tested on maixpy3 v0.4.8
# copy files to TF card and plug into board and power on
import sensor, image, lcd, time
import KPU as kpu
import gc, sys

input_size = (224, 224)
labels = ['数字1', '数字2', '数字3', '数字4', '数字5', '数字6', '数字7', '数字8']
anchors = [0.84, 1.22, 1.66, 2.34, 1.31, 1.75, 1.88, 2.59, 1.47, 2.09]

def lcd_show_except(e):
    import uio
    err_str = uio.StringIO()
    sys.print_exception(e, err_str)
    err_str = err_str.getvalue()
    img = image.Image(size=input_size)
    img.draw_string(0, 10, err_str, scale=1, color=(0xff,0x00,0x00))
    lcd.display(img)

def main(anchors, labels = None, model_addr="/sd/m.kmodel", sensor_window=input_size, lcd_rotation=0, sensor_hmirror=False, sensor_vflip=False):
    sensor.reset()
    sensor.set_pixformat(sensor.RGB565)
    sensor.set_framesize(sensor.QVGA)
    sensor.set_windowing(sensor_window)
    sensor.set_hmirror(sensor_hmirror)
    sensor.set_vflip(sensor_vflip)
    sensor.run(1)

    lcd.init(type=1)
    lcd.rotation(lcd_rotation)
    lcd.clear(lcd.WHITE)

    if not labels:
        with open('labels.txt','r') as f:
            exec(f.read())
    if not labels:
        print("no labels.txt")
        img = image.Image(size=(320, 240))
        img.draw_string(90, 110, "no labels.txt", color=(255, 0, 0), scale=2)
        lcd.display(img)
        return 1
    try:
        img = image.Image("startup.jpg")
        lcd.display(img)
    except Exception:
        img = image.Image(size=(320, 240))
        img.draw_string(90, 110, "loading model...", color=(255, 255, 255), scale=2)
        lcd.display(img)

    try:
        task = None
        task = kpu.load(model_addr)
        kpu.init_yolo2(task, 0.5, 0.3, 5, anchors) # threshold:[0,1], nms_value: [0, 1]
        while(True):
            img = sensor.snapshot()
            t = time.ticks_ms()
            objects = kpu.run_yolo2(task, img)
            t = time.ticks_ms() - t
            if objects:
                for obj in objects:
                    pos = obj.rect()
                    img.draw_rectangle(pos)
                    img.draw_string(pos[0], pos[1], "%s : %.2f" %(labels[obj.classid()], obj.value()), scale=2, color=(255, 0, 0))
            img.draw_string(0, 200, "t:%dms" %(t), scale=2, color=(255, 0, 0))
            lcd.display(img)
    except Exception as e:
        raise e
    finally:
        if not task is None:
            kpu.deinit(task)


if __name__ == "__main__":
    try:
        # main(anchors = anchors, labels=labels, model_addr=0x300000, lcd_rotation=0)
        main(anchors = anchors, labels=labels, model_addr="/sd/model-54796.kmodel")
    except Exception as e:
        sys.print_exception(e)
        lcd_show_except(e)
    finally:
        gc.collect()

修改后main.py

修改行数及作用

  • 第8行,显示标签重命名
  • 第28行,屏幕显示旋转
  • 第64~66行,识别数字后简单的串口打印
# generated by maixhub, tested on maixpy3 v0.4.8
# copy files to TF card and plug into board and power on
import sensor, image, lcd, time
import KPU as kpu
import gc, sys

input_size = (224, 224)
labels = ['1', '2', '3', '4', '5', '6', '7', '8']
anchors = [0.84, 1.22, 1.66, 2.34, 1.31, 1.75, 1.88, 2.59, 1.47, 2.09]

def lcd_show_except(e):
    import uio
    err_str = uio.StringIO()
    sys.print_exception(e, err_str)
    err_str = err_str.getvalue()
    img = image.Image(size=input_size)
    img.draw_string(0, 10, err_str, scale=1, color=(0xff,0x00,0x00))
    lcd.display(img)

def main(anchors, labels = None, model_addr="/sd/m.kmodel", sensor_window=input_size, lcd_rotation=0, sensor_hmirror=False, sensor_vflip=False):
    sensor.reset()
    sensor.set_pixformat(sensor.RGB565)
    sensor.set_framesize(sensor.QVGA)
    sensor.set_windowing(sensor_window)
    sensor.set_hmirror(sensor_hmirror)
    sensor.set_vflip(sensor_vflip)
    sensor.run(1)
    sensor.set_vflip(1)		#屏幕垂直翻转

    lcd.init(type=1)
    lcd.rotation(lcd_rotation)
    lcd.clear(lcd.WHITE)

    if not labels:
        with open('labels.txt','r') as f:
            exec(f.read())
    if not labels:
        print("no labels.txt")
        img = image.Image(size=(320, 240))
        img.draw_string(90, 110, "no labels.txt", color=(255, 0, 0), scale=2)
        lcd.display(img)
        return 1
    try:
        img = image.Image("startup.jpg")
        lcd.display(img)
    except Exception:
        img = image.Image(size=(320, 240))
        img.draw_string(90, 110, "loading model...", color=(255, 255, 255), scale=2)
        lcd.display(img)

    try:
        task = None
        task = kpu.load(model_addr)
        kpu.init_yolo2(task, 0.5, 0.3, 5, anchors) # threshold:[0,1], nms_value: [0, 1]
        while(True):
            img = sensor.snapshot()
            t = time.ticks_ms()
            objects = kpu.run_yolo2(task, img)
            t = time.ticks_ms() - t
            if objects:
                for obj in objects:
                    pos = obj.rect()
                    img.draw_rectangle(pos)
                    OutNum=labels[obj.classid()]
                    img.draw_string(pos[0], pos[1], "%s : %.2f" %(OutNum, obj.value()), scale=2, color=(255, 0, 0))
                    print(OutNum)
            img.draw_string(0, 200, "t:%dms" %(t), scale=2, color=(255, 0, 0))
            lcd.display(img)
    except Exception as e:
        raise e
    finally:
        if not task is None:
            kpu.deinit(task)


if __name__ == "__main__":
    try:
        # main(anchors = anchors, labels=labels, model_addr=0x300000, lcd_rotation=0)
        main(anchors = anchors, labels=labels, model_addr="/sd/model-54796.kmodel")
    except Exception as e:
        sys.print_exception(e)
        lcd_show_except(e)
    finally:
        gc.collect()

代码现象

在这里插入图片描述

  • 19
    点赞
  • 139
    收藏
    觉得还不错? 一键收藏
  • 54
    评论
### 回答1: K210是一款集成了人工智能处理单元的芯片,能够进行图像识别、语音识别等任务。如果要让K210进行数字识别,需要进行以下步骤: 1.收集数字图像:要让K210学会识别数字,首先需要收集一定数量的数字图像,包括数字1到9的不同字体、大小、颜色、角度等变化情况。这些图像可以通过数码相机、手机摄像头等设备获取,也可以从网上下载。 2.预处理图像:为了让K210更准确地识别数字,需要对图像进行预处理,包括图像大小归一化、灰度化、二值化、去噪等操作。 3.训练模型:将预处理后的数字图像输入到K210中,让其进行学习和训练,构建一个数字识别模型。训练过程中需要注意训练集和测试集的划分、模型的优化等问题。 4.测试和调试:训练完模型后,需要对其进行测试和调试,检查其在识别数字1到9的准确率和稳定性。 总的来说,K210识别数字1到9的过程并不简单,需要经过多个步骤的准备和处理,而且模型的准确率和性能也需要不断优化调整。但随着人工智能技术的发展,K210识别数字1到9的应用前景会越来越广阔。 ### 回答2: K210是一种基于人工智能芯片的开发板,其内置了一种特殊的算法,可以用于数字1至9的识别。这种算法基于卷积神经网络(CNN),可以有效地学习数字的特征,并且可以对输入的数字进行分类,从而实现数字识别功能。 在实际的使用中,用户只需要将数字输入到K210开发板中,经过算法分析和计算后,就可以得到输入数字的分类结果。这种识别功能适用于很多场景,比如可以用于安防监控、智能家居、自动驾驶等领域,帮助人们更加方便地完成一些工作。 当然,数字识别技术也存在一些局限性。比如对于一些模糊、噪声较大的数字识别效果可能不如人工识别准确。但随着人工智能技术的不断发展,数字识别技术也将会得到更加完善的提升和迭代。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 54
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值