基于k210的水果分拣

最新推荐文章于 2024-08-09 09:20:12 发布

小小雨都

最新推荐文章于 2024-08-09 09:20:12 发布

阅读量8.3k

点赞数 18

文章标签：神经网络程序人生经验分享

本文链接：https://blog.csdn.net/qq_33862616/article/details/105583068

版权

本文介绍了基于k210芯片进行水果分拣的项目，利用darknet深度学习框架训练YOLOv2-tiny模型进行水果识别。详细讲述了darknet的安装、数据处理、cfg文件配置、权重文件获取，以及训练过程，并提到后续会分享darknet模型转pb的步骤。

摘要由CSDN通过智能技术生成

前言

由于疫情原因，只完成识别部分，主控采用具有kpu加速的k210进行识别，网络传输打算采用esp32。水果分拣是本学期的一次综合实践课程，识别效果一般，勉强可以使用。
在这里插入图片描述
哔哩哔哩识别效果
采用堪智官方sdk，帧率大概29左右，在人脸识别demo基础上进行编写

darknet

darknet概述
darknet是基于c语言的小众深度学习框架，是有yolo作者编写，其官网地址darknet官网

darknet安装

在darknet官网有安装的详细方式，安装过程也相对简单，官网教程
这里采用百度aistudio演示,首先是通过git下载源码git clone https://github.com/pjreddie/darknet.git
之后便会在当前文件夹下建立darknet文件夹，cd darknet进入darknet文件夹，在这里插入图片描述
编辑配置可以在makefile文件进行更改，aistudio可以将文件后缀改为txt进行编辑，也可以使用vi进行编辑。

将gpu设置成1，如果使用cpu来训练，速度相当慢。

保存设置，使用make命令完成编译，会在当前文件夹下生成darknet文件。
在这里插入图片描述
至此darknet安装完成

训练数据处理

数据处理参照网上一篇文章进行处理link,使用LabelImg工具进行标注，工具采用python和qt进行编译，需要安装相应的库，软件的使用方式在github上有详细介绍，这里不做太多介绍labelimg，

首先是获取训练图片，如果使用的是maix板，可以使用micropython对目标图片进行获取这里借鉴link的代码

import sensor, image, time, lcd
from fpioa_manager import *
from Maix import GPIO
import os

def getMax():
   maxnum = 0;
   files = os.listdir('/sd')
   for file in files:
       name = file.split(".")
       if(len(name)>1 and name[1] == "jpg"):
           if(int(name[0])>maxnum):
               maxnum = int(name[0])
   return maxnum

fm.register(board_info.LED_R, fm.fpioa.GPIO0)
led_r=GPIO(GPIO.GPIO0,GPIO.OUT)

lcd.init(freq=15000000)

sensor.reset()
sensor.set_pixformat(sensor.RGB565) # Set pixel format to RGB565 (or GRAYSCALE)
sensor.set_framesize(sensor.QVGA)   # Set frame size to QVGA (320x240)
sensor.skip_frames(time = 2000)     # Wait for settings take effect.
sensor.set_hmirror(0)
sensor.set_windowing((224,224))
clock = time.clock()                # Create a clock object to track the FPS.

i = getMax() + 1

def capture():
   global i
   img = sensor.snapshot()
   filename = '/sd/' + str(i) + '.jpg'
   print(filename)
   img.save(filename)
   img.draw_string(2,2, ("%2.1f" %(i)), color=(0,128,0), scale=2)
   lcd.display(img)
   i = i + 1;

print("Start from %d" % i)

while True:
   led_r.value(0)
   time.sleep(1)
   led_r.value(1)
   capture()

这里会自动拍照并进行保存，图片分辨率为224*224

使用labelimg工具对目标进行标注，在
保存文件选择yolo格式，这里有两种保存方式，一种是voc数据集采用的xml文件保存放松，另一种是现在使用的txt文件保存格式，打开保存的txt文件,会显示5个值0 0.48567335243553006 0.5214899713467048 0.9255014326647564 0.9570200573065902
分别代表
物体类别物体中心位置 x 物体中心位置 y 物体宽度 x 物体高度y

在这里插入图片描述
接下来便是划分训练集和测试集

import glob, os

# Current directory
current_dir =

最低0.47元/天解锁文章

小小雨都

关注

18
点赞
踩
110

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫