如题,直接上图,看看数据集
成语点选和一般的点选验证码其实差别不大,一般的点选验证码是告诉你要点哪些文字了,这个用yolov5做目标检测识别匹配到就可以了,成语点选无非就是没有告诉你是哪几个字,从上面的数据集可以得知,需要填充的是四字成语,会空缺两个字,有左右括号代替,然后请填充成语也是在图片的最上方,这里其实思路就有了。
1、yolov5进行目标检测,识别出所有的文字与括号
2、将目标检测结果进行筛选,将最上方的目标筛选出来,这里还可以在进行筛选,将最上方的目标结果进行x排序,在通过识别出来的冒号进行筛选,最后会得到两个文字,与两个左括号和两个右括号
3、将文字与括号排序,然后得出成语的类型,例如AB, *号代表括号的位置,然后利用正则依次匹配成语库,得出m个成语(最后的成语匹配结果不一定只有一个成语)
4、得出空缺的m个成语后,