立即学习:https://edu.csdn.net/course/play/26257/326448?utm_source=blogtoedu
数据整理:
统一格式、错误数据清除、相似图去重、数据预处理、数据标注
统一格式:图片格式统一;名字统一(indexxx.png);
错误数据去重:模型筛选或人工筛选 python opencv库人脸识别去除;数量少人工筛选;
相似图去重:python-Levenshtein包,可直接安装基于Hash的去重算法;
数据预处理:从人脸获取嘴唇区域,使用OpenCV+Dlib定位嘴唇的关键点;
数据标注:Labelme 标注工具;github;