移动端ui问题智能诊断1——文字重叠样本构造

最新推荐文章于 2023-10-01 23:04:48 发布

dialogtwb

最新推荐文章于 2023-10-01 23:04:48 发布

阅读量420

点赞数

分类专栏：智能测试文章标签：人工智能机器学习 ocr python cv

本文链接：https://blog.csdn.net/dialogtwb/article/details/122203128

版权

本文介绍了如何使用OCR技术、二值转化和PIL库自动化构造移动端UI的文字重叠样本，以供AI模型训练。通过筛选文字区域，计算像素均值，最终在原图上生成异常样本。

摘要由CSDN通过智能技术生成

做这个东西有什么用？

在自动化过程中进行文字重叠智能诊断，需要训练AI模型，训练AI模型的前提是构造异常样本，传统手工收集的样本量级太低，所以需要自动化去构造数据样本，本文章说明了文字重叠样本如何构造。

1.通过ocr识别页面中的文字位置，识别阈值大于0.95进行筛选，删除数字区域和比较短的文字区域

原图
在这里插入图片描述
筛选

 	reader = easyocr.Reader(['ch_sim', 'en'])
    ret = []
    result_1 = reader.readtext(path)
    for info in result_1:
        if info[2] > 0.70:
            if len(str(info[1])) >= 3 and not bool(re.search(r'\d', str(info[1]))):
                print("筛选之后的文字==> "

最低0.47元/天解锁文章

dialogtwb

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
移动端ui问题智能诊断1——文字重叠样本构造

做这个东西有什么用？在自动化过程中进行文字重叠智能诊断，需要训练AI模型，训练AI模型的前提是构造异常样本，传统手工收集的样本量级太低，所以需要自动化去构造数据样本，本文章说明了文字重叠样本如何构造。1.通过ocr识别页面中的文字位置，识别阈值大于0.99进行筛选，避免图标文字的影响([[136, 232], [306, 232], [306, 286], [136, 286]], '宝宝辅食', 0.9878041744232178)([[336, 332], [540, 332], [540
复制链接

扫一扫

专栏目录