移动端ui问题智能诊断1——文字重叠样本构造

本文介绍了如何使用OCR技术、二值转化和PIL库自动化构造移动端UI的文字重叠样本,以供AI模型训练。通过筛选文字区域,计算像素均值,最终在原图上生成异常样本。
摘要由CSDN通过智能技术生成

做这个东西有什么用?

在自动化过程中进行文字重叠智能诊断,需要训练AI模型,训练AI模型的前提是构造异常样本,传统手工收集的样本量级太低,所以需要自动化去构造数据样本,本文章说明了 文字重叠样本如何构造。

1.通过ocr识别页面中的文字位置,识别阈值大于0.95进行筛选,删除数字区域和比较短的文字区域

原图
在这里插入图片描述
筛选

 	reader = easyocr.Reader(['ch_sim', 'en'])
    ret = []
    result_1 = reader.readtext(path)
    for info in result_1:
        if info[2] > 0.70:
            if len(str(info[1])) >= 3 and not bool(re.search(r'\d', str(info[1]))):
                print("筛选之后的文字==> "
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值