【实战】(以色列·特拉维夫大学)将 E4E 成功移植到Windows 10: StyleGAN2图像处理编码器的设计,支持Pytorch Cuda/C++ Extension

本文详细介绍了如何将E4E (encoder for editing) 项目成功移植到Windows 10,包括必备环境、虚拟环境创建、Pytorch环境安装、VC 2017编译环境配置,以及解决编码问题和运行代码的步骤。项目旨在提供StyleGAN2图像反演和编辑功能,通过反演编码器获得高质量、可编辑的潜码。
摘要由CSDN通过智能技术生成

StyleClip项目支持写一段文字,指导StyleGAN2生成具备指定特征的图像。但这个项目往往需要一些中间数据,比如:在Pytorch环境下对应于输入原图的StyleGAN2反演(Inversion)潜码,格式是 .pt 文件,这与基于tensorflow实现的StyleGAN2Encoder不同。StyleClip项目官网主页上推荐这些中间数据可以通过 e4e 工具推理得到,所以我们需要把 e4e 这个项目跑起来。

e4e 项目的相关资源:

论文地址:hthttps://arxiv.org/abs/2102.02766

Github项目:https://github.com/omertov/encoder4editing

【说明】e4e网络架构。e4e使用基于编码器(encoder)的方法,在控制失真量的前提下力求获得反演图像最佳的感知质量与可编辑潜码(editable latents)。它不仅关注于如何获得高质量的反演图像,更加关注于如何获得高质量的可编辑潜码,使得真实图像在数字孪生空间内具有更强的感知质量与演变能力。e4e编码器接收输入图像并输出单个样式代码w以及一组偏移量,Δ(1)......Δ(N-1),其中N表示StyleGAN样式调制层的数量。通过N次复制w向量并将每个 Δ(i) 添加到对应向量上来获得最终的潜码表示。

它的官网上说,项目的源代码只能跑在 Linux 或 macOS 上,现在我们把它移植到Windows 10上。以下为移植步骤和上手试用的简要介绍。

(一)移植到Windows 10

(1.1)必备环境

Windows 10,NVIDIA Geforce RTX 2080Ti,VC 2017/VC++ 2017版本15.4 v14.11工具集,Pytoch 1.6.0,cudatoolkit 10.1

(1.2)下载e4e(encoderforediting)项目

https://github.com/omertov/encoder4editing

将下载后的压缩包解压,创建encoder4editing工作目录,如:D:\AI\encoderforediting-main

或者,也可以使用Git工具(需要先安装Git,然后进入cmd,进入目录 D:\AI):

git clone https://github.com/omertov/encoder4editing.git
cd encoder4editing

(1.3)创建虚拟环境(PowerShell不能激活相应环境,请务必使用cmd)

在 environment子目录下创建文件 win_e4e_env.yaml ,内容如下:

name: e4e_env
channels:
  - conda-forge
  - defaults
dependencies:
  - _libgcc_mutex=0.1
  - ca-certificates=2020.4.5.1
  - certifi=2020.4.5.1
  - libffi=3.2.1
  - ninja=1.10.0
  - openssl=1.1.1g
  - pip=20.0.2
  - python=3.6.7
  - python_abi=3.6
  - setuptools=46.4.0
  - sqlite=3.31.1
  - tk=8.6.8
  - wheel=0.34.2
  - xz=5.2.5
  - zlib=1.2.11
  - pip:
    - absl-py==0.9.0
    - cachetools==4.1.0
    - chardet==3.0.4
    - cycler==0.10.0
    - decorator==4.4.2
    - future==0.18.2
    - google-auth==1.15.0
    - google-auth-oauthlib==0.4.1
    - grpcio==1.29.0
    - idna==2.9
    - imageio==2.8.0
    - importlib-metadata==1.6.0
    - kiwisolver==1.2.0
    - markdown==3.2.2
    - matplotlib==3.2.1
    - mxnet==1.6.0
    - network
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值