近期工作,接触到一些算法测试,以下为自己总结的测试记录,欢迎感兴趣的朋友对此指正
步骤1:制定评估标准,与产品、产品方沟通确定对算法的期望,把产品方的期望转化为成评估指标后,确定算法通过条件的标准
步骤2:准备测试样本集(样本集的数量根据排期确定,样本集种类与产品方、算法方确认)
步骤3:输出测试报告
目标检测算法的测试:
1.确定样本集:xx张图片、图片格式、分辨率、种类
通过准则:IOU>x
2.使用labelme工具标注图片
3.使用python程序对比输出结果,计算IOU(交并比)的值,输出测试报告和结论
人工标准测试结果
1.确定样本集:xx视频、视频格式、分辨率、编码格式、时长
通过标准:确定准确率、精确率、召回率
结果判断:TP(真的真样本)、TN(真的假样本)、FN(被识别错误的真样本)、FP(被识别错误的假样本)
准确率:A = (TP+TN)/(TP+TN+FN+FP)
精确率:p = TP/(TP+FP)
召回率:Recallv= TP/(TP+FN)
根据算法输出结果,计算通过指标
3.输出测试报告和结论
业务逻辑验证
1.接口层面验证
调用结果,可以统计算法分析时长耗时;
调整置信度,查看输入视频/图片的标注结果
2.数据验证
数据库存放存放的数据是否正确