UI 2 CODE中的深度学习+传统算法应用

闲鱼技术

于 2018-11-20 12:11:12 发布

阅读量406

点赞数

本文链接：https://blog.csdn.net/weixin_38912070/article/details/93857194

版权

文章探讨了在UI自动化中如何利用深度学习和传统算法进行图片到代码的转换。通过OCR获取文字位置、CNN鉴别、形状匹配等步骤，实现了复杂背景的前后景分离，有效地提取出有意义的结构信息。尽管存在挑战，如准确率和边缘切割问题，但此方法在处理多层和复杂颜色场景时展现出潜力。

摘要由CSDN通过智能技术生成

背景

在之前的文章中，我们已经提到过团队在UI自动化这方面的尝试，我们的目标是实现基于单一图片到代码的转换，在这个过程不可避免会遇到一个问题，就是为了从单一图片中提取出足够的有意义的结构信息，我们必须要拥有从图片中切割出想要区块（文字、按钮、商品图片等）的能力，而传统切割算法遇到复杂背景图片往往就捉襟见肘了（见下图），这个时候，我们就需要有能力把复杂前后景的图片划分为各个层级图层，再交给切割算法去处理，拿到我们期望的结构信息。

640?wx_fmt=png

经过传统切割算法处理，会无法获取图片结构信息，最终只会当成一张图片处理。

在业界，图片前后景分离一直是个很麻烦的命题，业界目前比较普遍采用的解决方案是计算机视觉算法提取，或是引入人工智能来解决，但直到现在，都没有百分百完美的解决方案。那是否能引入AI来解决这个问题呢，我们来看一下，目前使用AI并拿到比较不错结果的解法是fcn+crf，基本上能够把目标物体的前景轮廓框出来，但缺点也很明显：