Dressing in Order: Recurrent Person Image Generation for Pose Transfer论文介绍及Virtual try-on客户端的设计与实现

1 Dressing in Order: Recurrent Person Image Generation for Pose Transfer,Virtual Try-on and Outfit Editing论文介绍


论文标题截图:
论文标题
这篇文章作者提出了一种按序穿衣、服装试穿图像生成框架。按序穿衣指的是,用户先选择一个模特,可以是自己的照片。然后,按顺序指定要试穿的衣服,例如,先穿T恤,再穿一件衬衫,外面再套一件夹克。
作者主要采用了基于生成对抗网络(GAN)的深度神经网络来实现图像生成任务。相关理论这里就不做介绍了,对原理感兴趣的朋友可以去看看他们的论文。下面主要介绍一下论文中实现的几个有趣的任务。

1.1 姿势变换

在这里插入图片描述

如上图所示,生成模型能够在保持原图人物着装不变的情况下,将原图人物的姿势变为姿势图人物的姿势。

1.2 服装试穿

在这里插入图片描述

如上图所示,假如你想试穿一下带帽子那位女生的服装,那么你只要把模特图换成你自己的单人照就可以。

1.3 改变衣服款型

在这里插入图片描述

如上图所示,生成模型能把原图的短袖变成背心款式。

1.4 纹理变换

在这里插入图片描述

如上图所示,生成模型能将原图上衣的纹理变换为用户输入的纹理。
除了上述任务之外,论文还有其它任务,这里就不一一列举了,感兴趣的朋友可以去看看原论文。

2 Virtual try-on PC客户端设计与实现

对于时常网购衣服的用户来说,上述任务中的试穿功能是比较实用的。但是,原论文没有提供图形用户界面来调用这些功能,普通用户操作起来很不方便。为此,我用Qt开发了一个带图形用户界面的客户端程序。但是由于时间关系,只实现了试穿功能。下面就对这个客户端做个介绍。客户端项目源码可以到我的Github下载 。

2.1 客户端操作步骤

Step1:打开客户端可以看到下图所示界面。先从Model标签页选择一张模特图片。
在这里插入图片描述

图-1

Step2:再点击Garment标签,这个页面虽然显示的也是模特图片,但是这些图片主要是给模型提供服装。也就是说,模型能把模特身上穿的服装分割出来。用户通过勾选图片下方的Top、Bottom复选框来指定是要上身衣服还是下身衣服。Top指上身衣服,Bottom指下身衣服。它们可以从不同图片中选择,也可以取自同一张图片。
在这里插入图片描述

图-2

Step3:然后用鼠标点击页面下方那个绿色按扭。随后,窗口左侧上方会显示生成结果,左侧下方会显示刚才所选择的短袖和裙子,如下图所示。
在这里插入图片描述

图-3

不知道你注意到没有,绿色按钮左侧有个复选框<Tuck>,当需要把上衣塞进裤子里面时,可以把它打勾。由于有些上衣本身就是短款,所以即使<Tuck>没打钩,上衣看起来也像是塞进裤子里。

2.2 客户端架构

先上图

在这里插入图片描述

图-4

如上图所示,客户端主要分为四层。最上层是图形用户界面,它是在QT creator开发环境下用C++开发的。但是,论文作者的图像生成模型项目是用Python写的,所以需要C++能调用Python,这里就需要用到C++调用Python的API。为了调用方便,我把整个调用过程封装成一个类,这个类就是上图所示的C++调用Python接口类,对应项目中的PyCaller类。
此外,原论文作者项目中虽然有测试类供用户调用,但是因为论文涉及的任务比较多,所以类比较复杂,用起来不方便。为此,我仅针对试穿任务另外写了一个Python类,这个类就是上图中所示的神经网络模型调用类,专供C++层调用。
最底层是论文作者的图像生成模型。模型调用成功后会输出生成的图像文件。

2.3 类的设计与思考

2.3.1 标签页面类的设计

如图-1所示,客户端界面主要由两个标签页组成。这两个标签页可分别用两个类来实现。不过,我最初是想能不能只用一个类来实现这两个标签页。后来经过思考,发现这两个页面上的items具有不同的显示逻辑。如图-1所示,在Model标签中,任何时刻只能有一个item被选中。也就是说,当已经有一个item被选中时,如果用户点击了另一个item,那么先前选中的那个item要自动取消选中。而Garment标签的显示逻辑是,允许用户同时选中两个item。在已选中两个item的情况下,如果用户点击了其它的item,则最先选中的那个item要自动取消选中。而且,Model标签和Garment标签中的item内容也不一样。Model标签中的item只需显示一张图片,如图-1所示。而Garment标签中的item除了显示图片,还要显示两个复选框,如图-2所示。
此外,Garment标签页还有一个逻辑,那就是任何时刻只能有一个Top复选框和一个Bottom复选框被勾选。当已经有Top框被勾选时,如果用户再勾选其它Top复选框,那么之前那个已勾选的Top框要取消勾选。考虑到这些不同逻辑,最后还是用两个类分别实现这两个标签页。两个标签页的类图如下所示。
在这里插入图片描述

图-5

如上图所示,因为两个标签页都需要显示滚动条,所以两个类都继承了QScrollArea类。

2.3.2 C++调用Python类的实现

在这里插入图片描述

图-6

PyCaller类内容不多,调用python层神经网络模型的代码在try_on函数里面。类成员变量m_pInstance是Python层TryOn类的实例。这个实例只在PyCaller类实例化的时候加载一次,后续调用tryon函数无需重新加载,这样可以节省不少函数运行时间。

2.4 小结

总的来说,这个客户端的主要工作是界面的设计与实现。但是麻雀虽小五脏俱全,一个人做项目,须集需求、UI、开发、运维多个角色于一身,感觉还是有点不容易的。不过,项目完成后也有点成就感。需要项目源码的朋友可以点击这里Dressing-in-order_PC-client下载。




[参考文献]

[1] Cui A, McKee D, Lazebnik S. Dressing in order: Recurrent person image generation for pose transfer, virtual try-on and outfit editing[C]//Proceedings of the IEEE/CVF international conference on computer vision. 2021: 14638-14647.

以下是对提供的参考资料的总结,按照要求结构化多个要点分条输出: 4G/5G无线网络优化与网规案例分析: NSA站点下终端掉4G问题:部分用户反馈NSA终端频繁掉4G,主要因终端主动发起SCGfail导致。分析显示,在信号较好的环境下,终端可能因节能、过热保护等原因主动释放连接。解决方案建议终端侧进行分析处理,尝试关闭节电开关等。 RSSI算法识别天馈遮挡:通过计算RSSI平均值及差值识别天馈遮挡,差值大于3dB则认定有遮挡。不同设备分组规则不同,如64T和32T。此方法可有效帮助现场人员识别因环境变化引起的网络问题。 5G 160M组网小区CA不生效:某5G站点开启100M+60M CA功能后,测试发现UE无法正常使用CA功能。问题原因在于CA频点集标识配置错误,修正后测试正常。 5G网络优化与策略: CCE映射方式优化:针对诺基亚站点覆盖农村区域,通过优化CCE资源映射方式(交织、非交织),提升RRC连接建立成功率和无线接通率。非交织方式相比交织方式有显著提升。 5G AAU两扇区组网:与三扇区组网相比,AAU两扇区组网在RSRP、SINR、下载速率和上传速率上表现不同,需根据具体场景选择适合的组网方式。 5G语音解决方案:包括沿用4G语音解决方案、EPS Fallback方案和VoNR方案。不同方案适用于不同的5G组网策略,如NSA和SA,并影响语音连续性和网络覆盖。 4G网络优化与资源利用: 4G室分设备利旧:面对4G网络投资压减与资源需求矛盾,提出利旧多维度调优策略,包括资源整合、统筹调配既有资源,以满足新增需求和提质增效。 宏站RRU设备1托N射灯:针对5G深度覆盖需求,研究使用宏站AAU结合1托N射灯方案,快速便捷地开通5G站点,提升深度覆盖能力。 基站与流程管理: 爱立信LTE基站邻区添加流程:未提供具体内容,但通常涉及邻区规划、参数配置、测试验证等步骤,以确保基站间顺畅切换和覆盖连续性。 网络规划与策略: 新高铁跨海大桥覆盖方案试点:虽未提供详细内容,但可推测涉及高铁跨海大桥区域的4G/5G网络覆盖规划,需考虑信号穿透、移动性管理、网络容量等因素。 总结: 提供的参考资料涵盖了4G/5G无线网络优化、网规案例分析、网络优化策略、资源利用、基站管理等多个方面。 通过具体案例分析,展示了无线网络优化中的常见问题及解决方案,如NSA终端掉4G、RSSI识别天馈遮挡、CA不生效等。 强调了5G网络优化与策略的重要性,包括CCE映射方式优化、5G语音解决方案、AAU扇区组网选择等。 提出了4G网络优化与资源利用的策略,如室分设备利旧、宏站RRU设备1托N射灯等。 基站与流程管理方面,提到了爱立信LTE基站邻区添加流程,但未给出具体细节。 新高铁跨海大桥覆盖方案试点展示了特殊场景下的网络规划需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

遥望山海

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值