k210学习记录（数字识别）

最新推荐文章于 2024-07-24 13:26:18 发布

不吃橘子的橘猫

最新推荐文章于 2024-07-24 13:26:18 发布

阅读量505

点赞数 1

分类专栏： k210 文章标签：学习嵌入式硬件

本文链接：https://blog.csdn.net/weixin_73011353/article/details/131747986

版权

k210 专栏收录该内容

10 篇文章

订阅专栏

这段代码演示了如何利用MaixPy中的KPU模块对摄像头捕获的图像进行实时处理，识别手写数字。程序加载预先训练的MNIST模型，对输入的224x224图像进行灰度化、缩放和像素调整后，通过KPU运行模型进行预测，将结果显示在LCD屏幕上。特别地，针对全黑或全白图像可能导致的误识别（将全黑识别为5，全白识别为1），代码进行了额外的判断处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

示例代码：

import sensor, image, time, lcd
from maix import KPU
import gc

lcd.init()
sensor.reset()
sensor.set_pixformat(sensor.RGB565)
sensor.set_framesize(sensor.QVGA)
sensor.set_windowing((224, 224))
sensor.skip_frames(time = 100)
clock = time.clock()

kpu = KPU()
kpu.load_kmodel("/sd/KPU/mnist/uint8_mnist_cnn_model.kmodel")


while True:
    gc.collect()
    img = sensor.snapshot()
    img_mnist1=img.to_grayscale(1)
    img_mnist2=img_mnist1.resize(112,112)
    img_mnist2.invert()
    img_mnist2.strech_char(1)
    img_mnist2.pix_to_ai()

    out = kpu.run_with_output(img_mnist2, getlist=True)
    max_mnist = max(out)
    index_mnist = out.index(max_mnist)
    score = KPU.sigmoid(max_mnist)
    if index_mnist == 1:
        if score > 0.999:
            display_str = "num: %d" % index_mnist
            print(display_str, score)
            img.draw_string(4,3,display_str,color=(0,0,0),scale=2)
    elif index_mnist == 5:
        if score > 0.999:
            display_str = "num: %d" % index_mnist
            print(display_str, score)
            img.draw_string(4,3,display_str,color=(0,0,0),scale=2)
    else:
        display_str = "num: %d" % index_mnist
        print(display_str, score)
        img.draw_string(4,3,display_str,color=(0,0,0),scale=2)
    lcd.display(img)

kpu.deinit()

解析：

1、导入相关库，初始化摄像头和LCD屏

import sensor, image, time, lcd
from maix import KPU
import gc

lcd.init()
sensor.reset()
sensor.set_pixformat(sensor.RGB565)
sensor.set_framesize(sensor.QVGA)
sensor.set_windowing((224, 224))
sensor.skip_frames(time = 100)
clock = time.clock()

2、加载模型文件

kpu = KPU()
kpu.load_kmodel("/sd/KPU/mnist/uint8_mnist_cnn_model.kmodel")

3、新建while循环读取摄像头画面，然后复制一个112*112大小的画面，对像素进行取反等处理，再将图像传入KPU里进行计算，与模型文件做运算，最终得到最优识别结果和识别分数

while True:
    gc.collect()
    img = sensor.snapshot()
    img_mnist1=img.to_grayscale(1)
    img_mnist2=img_mnist1.resize(112,112)
    img_mnist2.invert()
    img_mnist2.strech_char(1)
    img_mnist2.pix_to_ai()

    out = kpu.run_with_output(img_mnist2, getlist=True)
    max_mnist = max(out)
    index_mnist = out.index(max_mnist)
    score = KPU.sigmoid(max_mnist)

4、背景全白或全黑会出现误识别问题（将全黑识别为5，全白识别为1），所以对数字1和5进行额外分析

if index_mnist == 1:
        if score > 0.999:
            display_str = "num: %d" % index_mnist
            print(display_str, score)
            img.draw_string(4,3,display_str,color=(0,0,0),scale=2)
    elif index_mnist == 5:
        if score > 0.999:
            display_str = "num: %d" % index_mnist
            print(display_str, score)
            img.draw_string(4,3,display_str,color=(0,0,0),scale=2)
    else:
        display_str = "num: %d" % index_mnist
        print(display_str, score)
        img.draw_string(4,3,display_str,color=(0,0,0),scale=2)
    lcd.display(img)

kpu.deinit()