概述
舌诊训练流程主要分为以下3个步骤:
1、数据集准备 需要准备训练所需的数据集(主要是jpg图片),这些数据集需要包含期望能识别的特征,如齿痕、白苔等等。每种特征建议能准备 50张以上的图片,一般样本图片数量越多,训练效果越好。
2、数据集标注 使用LabelImg等工具,打开每张图片,在图片上做标注。标注主要包含特征的边界、类别等信息。
3、数据集训练 把标注后的样本图片以及标注时生成的标注文件集合,发给视觉模型进行训练。最终得到模型训练后的权重文件。
操作
1、数据集准备:
(1)定义好需要识别哪些特征(如齿痕、白苔等),以及特征对应的类别名(由于视觉模型不支持中文类别名,可用数字ID、拼音、 英文标注特征)。
(2)准备包含这些特征对应的图片,如有齿痕的舌头 > 50张,有白苔的舌头 > 50张。
2、数据集标注:
(1)在windows上打开labelImg.exe。
(2)操作流程
① 打开待标注后保存标注文件的路径:点击“Open Dir”,选择待标注的图片数据集文件路径。
② 打开待标注后保存标注文件的路径:点击“Change Save Dir”,弹出路径选择框,选择好一个路径。设置成功后,后面生 成的标注文件,会自动保存在此路径下。
③ 设置标注格式:默认是“PascalVOC”,用鼠标在红框处点击一下,会切换成“YOLO”。
④ 标注框:点击标注框菜单“Create\nRectBox”,就可以在图片上进行标注了。标注时按住鼠标左键,把图片上的特征框选出来, 框选完毕松开鼠标左键后,会弹出一个填写类别的小窗体,在上面填写特征的类别,也可以在历史类别中选择一个类别。类别 名是在数据集准备时定义好的特征的类别名,目前不支持中文。另外在labelImg工具中,历史类别中会出现它内置的一些类别名, 这些可以不管它,填写我们自己的类别名即可。
⑤ 类别框及保存:在一张图上标注完毕后,在类别框中会出现刚才填写的类别,同时在图片上,标注矩形框左上方也会出现类别 名。每张图标注完后,切换到下一张图片前,点击一下左侧菜单栏里面的“save”按钮,保存我们的标注。
标注操作经验分享或建议:
a. 每张图上可以同时标注多个特征,如下图所示;
b. 由于舌头是图像识别时的基础特征,所以建议每张图上都标注一下舌头。
3、数据集训练:
所有图片数据集标注完后,把原数据集目录 (”Open Dir”指定的目录),以及保存的标注文件目录(” Change Save Dir”)发送给数 据集训练人,放入视觉模型中进行训练。训练完毕后,进行检验,如果有不合适的地方,可能需要反复的重新标注、训练。