MasterplanGAN通过生成式对抗网络, 赋能城市总体规划的智能渲染

城市数据研习社

已于 2024-07-25 09:56:07 修改

阅读量706

点赞数 10

文章标签：论文阅读

于 2024-07-14 14:11:44 首次发布

本文链接：https://blog.csdn.net/LFSJXS/article/details/140416316

版权

本次给大家带来一篇SCI论文的全文翻译！该论文提出了提出了一个通过人工智能算法智能绘制城市总体规划的原型，可以作为城市设计师和规划者在实际项目中节省时间的有用工具！

【论文题目】

MasterplanGAN: Facilitating the smart rendering of urban master plans via generative adversarial networks

【题目翻译】

MasterplanGAN：通过生成式对抗网络, 赋能城市总体规划的智能渲染

【 期刊信息】

Environment and Planning B: Urban Analytics and City Science；Volume 49, Issue 3, July, 2021

【作者信息】

Xinyue Ye, 德州农工大学, 美国
Jiaxin Du, 德州农工大学, 美国
Yu Ye, 建筑与城市规划学院，生态城市设计国际合作联合实验室（教育部），同济大学，四平路1239号，上海，200092, yye@tongji.edu.cn

【论文链接】

https://doi.org/10.1016/j.cities.2023.104680

【 关键词】

深度学习，生成式对抗网络，大师规划，城市设计，众包数据

【本文亮点】

提出了一个通过人工智能算法智能绘制城市总体规划的原型
以众包数据和生成式对抗网络（GAN）应用CycleGAN作为核心算法来构建模型
实现AutoCAD格式在MasterplanGAN中的实时渲染
通过定量和定性判断对生成的结果进行了验证
本研究成果有助于发展以前主观和经验导向的过程以节省时间
通过新的城市数据和新技术解决城市设计需求，推动城市设计的方法论边界
结合科学思维、设计和计算机技术，可以呈现出计算性城市设计的清晰蓝图

【摘要】

本研究提出了一个通过人工智能算法智能绘制城市总体规划的原型，这一过程耗时且依赖于专业人员的经验。在众包数据和生成式对抗网络（GAN）的帮助下，我们训练了一个一代模型，以提供类似于经验丰富的城市设计师制作的总体规划的彩色渲染。对大约5000个主计划进行了处理，并应用CycleGAN作为核心算法来构建该模型，即所谓的主计划计划。使用AutoCAD格式的无色输入设计文件，MasterplanGAN可以在几秒钟内提供主平面渲染。通过定量和定性判断对生成的结果进行了验证。本研究的成果有助于发展以前主观和经验导向的过程，可以作为城市设计师和规划者在实际项目中节省时间的有用工具。它还通过新的城市数据和新技术解决城市设计需求，推动城市设计的方法论边界。这一初步的探索表明，结合科学思维、设计和计算机技术，可以呈现出计算性城市设计的大而清晰的图景。

【引言】

1.1 新城市科学背景下的城市设计

大数据和计算算法的快速发展逐渐与建筑环境相结合，这导致了一种新的城市科学的兴起，表现为感知、数据收集和城市主义分析的新基础设施（汤森，2015）。越来越多的学者认为，未来的城市将利用新的城市科学，通过精确的城市分析和高效的设计生成来提高人类体验（Kvan，2020；奥芬胡伯和Ratti，2014；调谐器，2020）。c基于多来源的城市数据和分析工具，现在可以实现精确的城市分析，以帮助城市设计师提供关于人们如何使用城市空间的信息（Noyman等人，2019；叶等人，2017），他们对他们的感受(Naik等人，2014；Roe等。，2013；Ye等人，2019年），以及空间如何影响相关的社会经济表现(Li等人，2015年；龙和黄，2019年；张和东，2018年）。以人类感知维度为例；在建筑环境研究中出现的可穿戴生物传感器有助于直接揭示这种无形的感觉（Roeetal.，2013）。将眼级街景图像与深度学习算法相结合，开发了一种新的方法来测量各种视觉感知（Naik等人，2014年；Ye等人，2019年）。

除了来自城市分析的新见解外，计算工具和大数据的集成也有助于城市的设计方式（Long and Ye，2019年；Tang等人，2020年）。与依赖人工迭代和经验的传统城市设计方法相比，计算算法的出现被用于快速城市设计原型（Miao等人，2018；Wilson等人，2019）。

1.2 挑战和潜力：从数据信息转向算法驱动

自2010年代以来，随着信息和通信技术的快速发展，这种基于数据信息的趋势一直在增加（LonGANdYe，2019）。该领域的代表性研究包括对“不可测量”空间质量的测量（胡等，2020；奈克等，2014；叶等，2019)，定量提取城市形态（D‘Acci，2019；奥利维拉和梅德罗斯，2016；叶和范内，2014），并评估城市活力（龙和黄，2019；叶等，2018；Zhang等，2020年）。
      虽然新的城市数据所提供的机会已经得到了广泛的认可，但这一领域的研究仍然没有深入解决当前的城市设计过程（alıkan，2017）。Cs如Wilson等人所述。（2019年），虽然大数据显示了为城市设计提供一种迭代方法的巨大希望，但它在当前设计过程中的地位仍未得到开发。其主要原因是，这些探索并没有解决当前城市设计过程中的瓶颈。一个有经验丰富的城市设计师可以使用直观的方法来处理城市分析中的这些复杂性，并且仍然可以实现良好的设计。换句话说，我们可能需要寻求一个与城市设计过程的特定阶段紧密相一致的新视角。在这种情况下，应用计算算法来整合新的城市数据来探索城市设计的方法边界似乎是一种新的方法（Koenigetal.，2020）。

然而，建筑和城市设计中存在的算法驱动研究主要关注智能设计生成（洲楼，2020；何和杨，2019；黄和郑，2018；Nauata等人，2020)，特别是通过一些输入生成建筑布局或城市设计规划。换句话说，研究人员热衷于用计算算法来取代设计师的角色。很少有研究关注开发设计辅助可以集成到整个设计工作流程中的工具（Ye等人，2020年），这就留下了一个值得进一步探索的领域。

1.3 总体规划渲染是城市设计工作流中的一个耗时阶段

根据一些城市设计研究者（Jones，1992；Lawson，2005），一个一般的城市设计工作流程是一个包含两个阶段的循环，设计生成和设计开发。利用客户提供的设计简介，城市设计师开始根据他们的经验和直觉产生设计理念（Karimi，2012；Ye等人，2017）。经过设计师之间的多轮内部讨论和与利益相关者的协商，这些想法被开发为设计解决方案。因此，一个城市设计项目通常包含许多轮的咨询和设计修订。这些对城市设计规划的修改和重新渲染是非常费时的。花几天甚至几周的时间手动重新绘制城市设计计划是很常见的（坎特雷尔和迈克尔斯，2015年；弗雷德里克和梅塔，2018年）。考虑到城市设计项目的进度通常比较密集，需要设计师加班加点，手工渲染设计方案的耗时过程已成为城市设计工作流程的瓶颈。作为回应，开发一种能够自动绘制设计计划的计算方法对城市设计师似乎是有意义的。简而言之，一种新的研究潜力正在出现，并有可能为城市设计的实践带来更高水平的效率。

【相关研究】

2.1 生成式对抗网络及其对艺术设计师的好处

人工智能（AI）的进步使计算机能够从设计师的直觉中学习，这有可能成为我们管辖范围内的游戏规则改变者（杉原，2019）。在这些算法中，生成对抗网络（GAN）通过提供图像生成能力，使人工智能离设计问题更近了一步（Chaillou，2019）。GAN是一种训练范式，无监督机器学习模型通过相互训练两个网络来学习输入数据的表示（Goodfelletal.，2014）。生成器试图产生一个真实的“假”图像，而鉴别器被用来判断该图像是否是假的。利用GAN，开发了一系列新的算法。深度卷积生成对抗网络（DCGAN）使用卷积神经网络对图像表示进行编码和解码。这种架构已经成为后期图像生成网络的基础，因为它在生成高质量图像方面的良好结果（Yuetal.，2017）。这种新颖的结构允许快速训练强生成器来编码和解码图像表示，这使得系统可以从现有的图像或其他视觉艺术中学习风格设计标准，以提供新的设计选项。因此，与GAN相关的算法具有多种设计和艺术应用，包括绘画风格转移(Kang等。、动态标志设计（Yangetal.，2019年）和纺织品设计（Liu等人，2019 年）。

2.2 探索GAN与建筑、城市设计的结合

受GAN探索在许多设计过程中应用潜力的启发，研究人员已经开始将建筑和城市设计作为研究领域。初步勘探主要集中在平面图分析上。Huang和Zheng（2018）应用了Pix2pixHD，这是GAN的一个改进版本，可以成对地学习图像数据并生成基于输入的新图像，以识别和生成公寓的平面图。沿着这些思路进行了一系列研究，基于对大量平面图图像的学习，生成高质量的住房布局，包括乔尔卢的档案规划（2020年）和Nauata的住宅规划等人的住宅住房布局(2020)。

此外，GANs已被应用于具有建筑规范限制的社区总体规划的自动生成（HeandYang，2019）。虽然GANs可能不能创造出完全适合的设计选项，但它们的输出可以为激励经验丰富的设计师提供巨大的起点。一种类似的技术也被应用于检查设计计划是否与规划权限相匹配（He，2020）。简而言之，加纳斯在解决高度约束的问题方面提供了显著的灵活性。虽然目前这一领域的研究主要集中在智能设计生成上，但我们可以期待可以将其应用于许多其他耗时的设计阶段。

2.3 目前的差距和我们的研究

      如上所述，有两个明显的研究差距。首先，最近的GAN相关算法主要集中在艺术绘画上，包括图像风格转换、标志和纺织品设计。现有的方法在视觉艺术生成方面表现出了显著的能力。然而，它们至今才被应用于主平面图像的智能渲染中。需要通过探索来进一步开发与GAN相关的算法，以将其能力扩展到总体规划绘制和绘图的新领域。其次，现有的计算辅助设计研究主要集中在设计生成上，而不是设计开发上。这些研究大多属于“生成”维度，它探索了通过计算算法自动生成设计计划的方法。只有少数研究属于“开发”维度，即试图生产可以集成到设计项目的工作流中的工具。

为了应对这两个差距，我们的研究将通过开发一种能够进行智能渲染设计计划的计算方法来扩展GANs的应用边界。由于GAN在解放设计劳动力从执行重复性工作方面的能力已经被承认，我们可以重塑这个耗时的阶段。

【方法论】

3.1 分析框架

MasterplanGAN的开发包括三个阶段：(1)数据准备，(2)构建MasterplanGAN，(3)结果评估（图1）。首先，在数据准备阶段收集了两种类型的数据：作为训练数据的高质量的总体图效果图和由同一设计公司的一组城市设计人员提供的6个具有图形交换格式（DXF）的总体图。其次，MasterplanGAN是基于CycleGAN构建的，这是一种著名的GAN算法，擅长于不配对图像到图像的转换（Zhuetal.，2017）。经过大量高质量的总体平面图的训练，我们可以将只有灰度线条的城市设计草图转化为彩色效果图。采用DXF格式的主平面图作为最终检查，提供像素校正模型，提高主平面图生成的输出质量。最后，通过自动指标和人工判断，进行定量和定性评价来检验该方法的准确性。

图1.分析框架

3.2数据收集和准备

训练数据集中使用的总体平面图从Plestey(https://in.感兴趣。com/)，这是一个基于形象的分享和社交媒体服务网站。它的视觉搜索引擎基于图像，允许用户快速搜索具有一定相似性的高质量的总体计划，便于后续的训练过程。具体来说，Pintey的视觉搜索系统是建立在亚马逊云平台上，云上有现成的计算机视觉工具，能够在颜色、纹理和视点上提供相似风格的图像（Jingetal.，2015）。在Python抓取的帮助下，我们首先使用关键词“总体计划”和“站点计划”来检索带有相应文本标签的图像。然后，通过进行基于像素相似度的图像搜索，对数据进行放大。我们收集了1万多张图像，然后手动过滤掉不属于主计划的图像，例如鸟眼视图或透视图。最后，我们获得了一个包含大约5000张图像的主平面图像数据集。

黑白主平面草图被收集为原始的AutoCAD文件(在。dxf格式)。我们将它们转换为便携式网络图形（PNG）文件，以便它们可以以标准的图像格式进行处理。从每个AutoCAD文件中生成两个灰度PNG文件，一个包含AutoCAD中的所有线特征作为我们的模型的训练数据，另一个只包含将在像素校正模型中使用的建筑布局。不需要额外准备CAD文件。
      深度学习模型依赖于来自图形处理单元（gpu）的并行计算能力。为了方便并行计算，通常通过双边插值将图像转换为相同的分辨率（Keys，1981）。目标分辨率分别为256人256和1024人1024，因为它们通常用于图像生成研究。

【分析：构建总体规划】

4.1 由CycleGAN开发出来的训练结构

对配对和未配对数据集进行了测试，最终选择未配对训练结构。Canny边缘检测（Canny，1986）最初应用于从收集的主平面图中提取轮廓信息。通过这种方式，所有的感兴趣数据成为成对的训练集，包括草图和渲染的图像。然而，目前还没有一种完美的算法能够完美地从主平面图中重建一个草图，这意味着成对的训练数据集存在许多缺陷。一个更好的解决方案是直接使用未配对的数据。因此，我们对设计用来训练非配对数据的CycleGAN（Zh uetal.，2017）进行了测试，并最终选择其作为开发训练结构的基础。配对和未配对数据集之间的差异如图2所示。基于CycleGAN的架构，进一步建立了主规划计划，以更高的效率和准确性解决总体规划设计过程中的特殊问题。在主平面上添加了一个特殊的像素校正模块，以保持主平面的整体正确性。本节中将介绍该模块的详细信息。

4.2 总体规划GAN目标函数

主平面渲染可以生成为从黑白草图x到彩色渲染的主平面y的映射。因此，这项工作的目标是建立一个生成器(G)，从而使G(x)¼y。受GAN的启发，我们将一个深度神经网络训练为fx、yg数据中的G，同时，训练一个鉴别器(D)来检测生成器是否未能生成目标结果。

深度神经网络是急需数据的，这意味着我们需要大量的训练样本来让模型学习如何渲染主计划。很难获得如此大的、成对的数据集。从收集方面来看，草图样本可以表示为fxigN i¼1，其中xi属于黑白图像采集X。渲染图像样本可以表示为fyjgM j¼1，其中yj属于渲染总体规划集合Y. M和N是样本的数量。数据分布（可以看作是一种样式）被表示为x~pdata(x)和y~pdata(y)。生成的图像可以表示为G(X)=Y。类似地，将渲染图像转换为草图的对称生成器可以定义为F(y)=x或F(Y)=x（图3）。

在MasterplanGAN中，引入了另外两种对抗性鉴别器DX和DY来提高生成器的性能。DX旨在区分草图{x}和渲染图像{F(y)}；同样，DY的目的是区分渲染结果G{X}和真实的总规y。然后，制定了两个目标来描述这个目标：匹配草图和呈现的主规划分布的对抗性损失，以及防止学习到的映射G和F相互冲突的循环一致性损失。G生成的图像与其他领域的图像相似，D区分假图像和真实图像。

G和F都接受了对抗性损失的训练。对于一个生成渲染图像的函数G：X！Y及其鉴别器DY，其目标可以描述为以下损失函数，其中G试图从集合Y中生成看起来相似的图像G(x)，而DY来判断G(x)是否来自集合Y。

图2.配对的训练数据（左）和未配对的训练数据（右）。G是绘制草图的生成器，而F是G的对称函数。

总体规划GAN还引入了一个额外的损失，称为循环一致性损失。在G和F生成与输入域分布相似的图像后，周期一致性损失保证了当将生成的图像输入到其他生成器时，生成的图像可以恢复到原始域。循环一致性损失表示为:

结合对抗性损失和周期一致性损失，总体规划GAN的全部目标函数是:

最后，训练生成器的全部目标可以表示为:

它有助于组合多个优化的问题。G和F是试图在目标集合中产生类似图像的生成器，而DX和DY是试图区分生成的图像和目标集合中的图像的鉴别器。它也可以看作是一个最小最大博弈，其中最优状态是纳什均衡(古德费勒等。,2014)。

4.3总体规划GAN网络实现

生成器（G、F）和鉴别器（D）的网络结构如图4所示。生成器有不同的目的（G用于渲染图像，F用于提取草图）。它们共享相同的网络结构，但具有不同的可学习性参数。在鉴别器网络之间也存在着同样的关系。鉴别器网络具有相同的网络结构，但在训练过程中更新自己的参数。

图3.训练总体规划GAN时的数据流

生成器网络包含两个步2卷积和几个残余块（Hanetal.，2016）。所有图像数据均使用实例归一化方法进行归一化（Ulyanovetal.，2016），并使用9个残差块进行处理。鉴别器网络使用70人70PatchGANs，目的是对70人70重叠图像块进行分类。这种补丁级鉴别器架构可以以完全卷积的方式工作于任意高分辨率的图像（Isola等人，2017）。在最后一层之后，应用扣除维数为1的卷积，然后通过二值分类器对输出进行分类。卷积神经网络后使用的激活函数是泄漏的ReLUs（Xuetal.，2015），斜率为0.2。该鉴别器的体系结构为c64-C128-C256-c512-分类器。关于该分类器的更多细节可以在Zhu等人的文章中找到。(2017).网络参数是通过反向传播或交替地最小化目标来学习的。

4.4训练过程

对抗性的训练过程需要仔细安排，因为基于GAN的模型在训练过程中很容易被损坏（Goodf elletal.，2014）。考虑到生成高分辨率图像的要求，应保持生成器和鉴别器的效率。在我们的数据集上对单个NVIDIATitanRTXGPU进行的初步测试成本大约为一周，训练模型的推理时间为半小时，这对于实际设计项目的工作流程来说是不可接受的。

因此，我们采用了分治策略来有效地训练模型。分辨率为1024人，1024分辨率的图像被裁剪到256人，256分辨率，并输入模型。裁剪后的图像被放在一起，形成最终的1024人1024图像。该作物方法是计算机视觉中广泛应用的数据增强技术，最初由Zhu等人引入。(2017).对于与GAN相关的算法，生成器和鉴别器需要同时在GPU中运行，因此通常需要非常大的GPU内存。这种作物种植方法不仅有助于使用有限的GPU内存实现类似的性能，也比直接尝试的训练过程得到更稳定的结果。

图4.MasterplanGAN中生成器（上）和鉴别器（下）的网络结构

该训练是在一台拥有2台NVIDIATitanRTXGPU、16核IntelXeonCPU、192GB内存的服务器上进行的。用200个epoch训练模型花了大约2天的时间，批量大小为8。因此，现在训练过的模型可以在不到一分钟的时间内推断出（着色）图像。MasterplanGAN中G着色组件的训练损失如图5所示。

从训练损失中可以看出，生成器(G)的损失趋势增加，鉴别器(D的损失趋势增加X)减少，这符合我们在等式(4)中的目标。结果表明，生成器(G)能够更好地着色，和鉴别器（DX)使得很难判断彩色图像是否来自生成器。我们从训练过程中获得了示例结果（表1）。

很明显，该模型学会了如何用更多的训练时代来更好地为草图着色。经过125个时代后，该模型变得相对稳定，并产生了可接受的结果。这一趋势与训练损失的趋势一致。如表1所示，不同时期的彩色图像呈现出不同的渲染风格。生成这些图像的相应训练模型有潜力被开发为样式转换工具，以生成具有不同样式的主计划。这是这个培训过程的一个副产品。

4.5 像素校正模块

在程序的末端放置一个像素校正模块，以保持主规划的主要结构正确。考虑到所有基于像素的GANs都是一种模型，可以生成可能来自现有样本分布的新例子，这些GANs只能实现像素到像素的转换，而不能识别主计划的组件，例如。街道，建筑布局，绿地，供水系统。因此，即使是一个训练有素的GAN模型，仍然有可能在建筑布局中绘制绿色。为了避免这些错误，我们开发了该像素校正模块，这可以根据AutoCAD文件修改MasterplanGAN的输出，以确保建筑布局位于正确的位置。具体来说，该模块从AutoCAD文件中读取建筑布局，然后记录每个建筑布局的位置，以构建一个校正掩模。通过将生成的结果与校正掩码集成，它会对生成的图像进行修正，并提供最终的输出。

图5.生成器(G)和鉴别器（DX）训练损失

此外，不同的AutoCAD文件通常包含表示建筑物的不同层名称，例如，“建筑物”（复数）、“建筑物”（任意大写）、“构造”（拼写错误）。为了最大化设计者的利益，在我们的MasterplanGAN中开发了一个上下文语言标识符，以实现从AutoCAD文件中自动识别构建层。在采访了10名城市设计师和他们提供的数百个CAD文件中的层名之后，准备了一本包含一系列常用名称的字典。首先，我们从AutoCAD文件中提取了所有的图层名。第二，所有字母都转换成小写。第三，我们计算了层名和我们准备的字典中的单词之间的距离（莱文什坦，1966），它测量了将一个单词更改为另一个单词所需的最小变化。如果列文什坦距离小于3，我们将其表示为匹配，从而成功识别出建筑层。这个距离要求，即3，是根据Schutze等人（2008）对信息检索的研究而设定的。在我们准备的字典中，与单词获得更高的洛温斯坦距离的层名将不会被识别为以下分析中所需的关键层。第四，我们使用了一个上下文感知语言模型（Devlin et al.，2018），该模型将单词转换为数值向量，从而可以计算出不同单词之间的语义距离。对于AutoCAD文件，图层名称中的所有单词都用作上下文。我们准备好的字典中的所有单词也可以作为上下文。然后，我们计算了图层名与字典之间的语义相似度。然后可以找到层名称和字典之间的最近的距离，我们将其表示为构建层。

表1.从时代1到时代200的训练过程中的一个代表性样本

【结果和验证】

5.1 基于总体规划GAN的训练结果

如图6所示，经过训练的MasterplanGAN可以基于AutoCAD格式的无彩色输入设计文件提供主平面渲染。具体来说，从CAD文件到最终的1024人1024渲染图像的智能渲染在我们的服务器上花费大约5-10秒，1NVIDIATitanRTXGPU，16核英特尔至强CPU，192GB内存。CAD文件内部的层数不会影响速度，但图像的大小在计算过程中确实起着重要的作用。更大的图像尺寸将需要更高的计算能力和时间成本。以前依赖于耗时的手工操作的城市设计总体规划的绘制现在可以在几秒钟内实现。这种自动生成方法可以作为城市设计师和规划者在现场项目中节省时间的有用工具。

5.2 比较Masterplan与基于GAN模型的精度

现有的基于GAN的模型，如Pix2pix（Isola等人，2017年）和StyleGAN2（Karras等人，2020年），已被应用于与新开发的MasterplanGAN进行比较。图6.从AutoCAD设计输入文件（左），并基于MasterplanGAN（右）生成输出

具体来说，Pix2pix是一个基于GAN的配对数据训练的模型。Pix2pix的目标是执行从源图像到目标图像的像素级转换。它要求源图像和目标图像具有相同的分辨率和一定的相似性，以达到最佳效果。StyleGAN及其新版本StyleGAN2在风格转移文献中获得了一个生成器架构。它们是制作高分辨率假人脸的最佳模型之一（Karras等人，2019年）。该系统可以学习高级属性的无监督分离，例如，姿态和身份，当对人脸进行训练时，以及生成的图像中的随机变化，从而实现直观的、特定尺度的合成控制。与第一个版本相比，StyleGAN2 提高了图像质量和训练效率。Pix2pix和StyleGAN2的训练结果见表2。看来Pix2的pix和StyleGAN2的表现都不够好。此外，图示显示，像素校正模块后的渲染效果更好，与手动渲染非常接近。

此外，通过Frechet起始距离（FID）对不同模型的性能进行了定量比较（Heusel et al.，2017）。FID是一个自动度量方法，它计算真实图像和生成图像之间的距离。它从原始图像中获取由初始v3模型（Szegedy et al.，2016）生成的特征向量，并根据公式(5)进行计算:

“u1”和“u2”指真实和生成图像的元素向量平均值。c1和c2分别是实特征向量和生成特征向量的协方差矩阵。Ku1-u2k2是指两个平均向量之间的平方和差。Tr是指跟踪线性代数运算。这个分数被称为d2，表明它是一个距离，并且以单位为平方。

简而言之，FID评分用于评估图像生成的图像质量，较低的分数被证明与较高质量的图像有很好的相关性。FID分数对于不同模型的结果如表2所示，这表明具有像素校正的MasterplanGAN在这些模型中表现最好。与其他现有的模型相比，大师还获得了更有效的训练过程。

5.3 结果验证

验证这些生成结果的一个困难方面是，呈现质量本质上是一种规范值。换句话说，生成的图像作为先验知识的质量可以很容易地通过经验丰富的城市设计师的直觉来判断，但由于缺乏标准参考，难以产生明确的验证。因此，我们应用了另一种方法来运行验证。

受区分人工智能和人类的图灵测试（图灵，1950年）的启发，生成的结果和从互联网上收集的人工渲染之间的两两比较已经被开发出来。如果从MasterplanGAN中生成的图像质量可以看作是普通的手动渲染，那么它们就可以进行验证。共选择20张样本图像，其中一半通过MasterplanGAN生成。我们招募了23名具有建筑学或城市规划专业学位的参与者作为专家小组。12名参与者是来自大学方面的教师、博士生和硕士学生，其余的都是实用的建筑师和城市设计师。每个参与者的偏好的权重是相等的。

然后制作了一个基于java的程序，通过两两比较来收集专家小组对哪个图像看起来更好的偏好（图7）。换句话说，专家们选择了左侧图像的质量是否高于右侧图像。这些参与者被要求在5秒内做出决定，以收集他们的直觉感知。这是因为设计师的直觉可以被视为评价图像质量的一个基准。每个参与者都被要求进行150次两两比较。

在这3450对两两比较中，生成的图像在786项比较中被评价为更高的质量，总计22.8%。相比之下，在互联网上收集到的图像在24.7%的两两比较中显示出质量更高。与此同时，52.5%的比较显示出难以做出决定。简而言之，生成的图像被判断为与手工渲染相似的质量。同样值得注意的是，一些生成的样本图像比其他生成的对等图像表现得更好。其根本原因是训练数据和测试数据之间的数据转换。一个总体计划会获得更好的性能。在训练数据中，如果它具有更高的相似性，则看起来更像是手动渲染。考虑到这项开创性的研究获得了一个相对有限的约5000张图像的数据集，从测试草图中产生的不同性能应该是不可避免的。这个缺点应该通过在我们接下来的研究中扩展训练数据集来很容易地解决。

【讨论】

6.1 尝试在深度学习算法的帮助下结合设计和科学

本研究应用深度学习算法开发了一种自动的方法来巧妙地呈现城市总体规划。在众包数据的帮助下，一个名为MasterplanGAN的一代模型经过训练，能够提供与经验丰富的城市设计师类似的彩色总体图渲染。在以AutoCAD格式输入设计的计划后，可以在几秒钟内实现与手动渲染质量相似的自动渲染。考虑到一个城市设计项目通常包含的内容，经过多次对主计划的修改和重新渲染，这种改进可以直接帮助设计者。

表2.比较现有的基于GAN的模型和MasterplanGAN模型的性能

表2的续表图7.对样本图像进行标记专家选择的两两比较。当左侧达到更高的质量时，参与者会选择“>”。然后，当图像质量较低时，应该选择“<”。当很难决定时，应该选择“=”。

值得注意的是，主计划并不是一个简单的应用自行车。基于从领域知识中收集到的需求和数据集，我们进一步开发了专门的GAN结构MasterplanGAN，以有效地呈现城市设计总体规划。与原始的自行车车相比，该杰作不仅显示了更高的效率和准确性，而且还获得了额外的特性。像素校正模块，以及直接读取AutoCAD格式数据的能力。这些改进为总体规划在城市设计的整个工作流程中带来了更大的潜力。

此外，这项研究强调了另一个通常被忽略的研究方向。深度学习算法的快速发展不仅为设计生成带来了新的潜力（Chaillou，2019；他和杨，2019；Nauata等人，2020年），而且还可以在另一个方向提供有意义的帮助。虽然不试图取代设计者在整个工作流中的角色，但当在设计过程的特定阶段应用时，系统可以提供一个有效的工具，以解决总体规划呈现的耗时阶段，以节省实时项目的时间。这种新方法仍然处于设计世界的开发的初期阶段，并引起了人们对所需的高计算能力和专门的编码技能的关注。然而，如果该技术在未来得到更广泛的接受和普及，就可能会在建筑和城市设计领域有一系列新的应用。换句话说，现在有可能在设计导向的直觉和科学思维之间架起桥梁。我们可以观察到一个从“设计中的科学”到“科学中的设计”的新兴转变。“我们希望这篇论文将有助于拓宽对计算城市设计的大但也清晰的图景的理解，它整合了科学思维、设计和计算机技术。”

6.2 总体规划GAN在城市设计过程中的潜在应用

城市设计过程概括为一个循序渐进的决策过程，从场地分析、思想归纳、思想评价咨询、设计开发和公众参与、设计修订开始，最后以输出结束（Karimi，2012；朗，2005；Moughtin等人，1999）。换句话说，一个典型的城市设计过程包含许多轮内部和外部咨询，通常需要设计计划演示和修订。通过有效地制定城市设计规划，策划计划有助于加速整个项目。同时，节省下来的时间可以用于现场调查和与利益相关者的协商，以协助比以前更精确的设计决策。此外，设计草图的快速渲染为在有限的时间内进行深入的设计可视化提供了帮助。大师规划者的这种能力可以帮助城市设计师清楚地审查他们的设计理念，并进一步以更高的效率开发方案。此外，该策划者不仅为设计师本身，也为其他利益相关者带来了利益。非专业设计师甚至公众更容易以可视化的方式表达他们的选择，这有助于人们更深入地参与公众的参与。

6.3 局限性和未来的改进

首先，总体规划GAN的结构有有待改进的潜力。目前的结构侧重于对整个图像的训练，这使得很难实现高度精确的渲染，因为很难精确地识别所有项目的边缘。出于同样的原因，很难适当地添加构建阴影。这是影响生成图像质量的两个主要缺点。在我们的下一个研究中，我们将应用AutoCAD文件来对各种设计组件进行分类，例如，建筑、道路网络、绿色空间和水。GANs将分别用于训练一系列专注于不同项目的生成模型。我们相信，这种新的结构将表现得更有效。此外，新的结构还将有助于更准确地添加建筑阴影，因为这将有一个单独的培训和生成过程。

其次，由于数据的可用性，在未来的研究中可以提高训练图像的内部一致性。虽然Pinterest的视觉搜索引擎允许我们收集具有一定相似性的高质量的总体图，但这些训练图像之间的一致性仍然可以提高。我们正在寻求一家设计公司的帮助，以收集大量的高一致性的主规划。这样一来，主计划引擎就会比当前的版本表现得更好。

此外，当前的MasterplanGAN只能实现具有固定渲染样式的生成。考虑到GANs在风格转移方面的强大能力，我们正在寻找一个具有不同渲染风格的大型训练数据集，以实现生成的总体规划设计的快速风格转移。

【结论】

本研究结合gan相关算法和从互联网上收集的众包数据，提出了一种计算城市设计工具MasterplanGAN，用于巧妙地绘制城市总体规划。这项耗时且依赖于专业人士经验的任务现在可以巧妙地完成了。使用AutoCAD格式的无彩色输入设计文件，MasterplanGAN可以在几秒钟内提供主平面渲染。彩色渲染的主图的输出与经验丰富的城市设计师的相似。总的来说，这种gan辅助的方法和在本研究中获得的见解可以由城市主义研究人员、城市规划者和城市设计师在许多方面应用。我们期望这项研究能够刺激在计算城市设计领域的探索，因为它是对将系统和科学的思维引入到以前基于定性和直觉的城市设计领域中日益增长的学术兴趣的回应。

城市数据研习社

关注

10
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
MasterplanGAN通过生成式对抗网络, 赋能城市总体规划的智能渲染

本次给大家带来一篇SCI论文的全文翻译！该论文提出了提出了一个通过人工智能算法智能绘制城市总体规划的原型，可以作为城市设计师和规划者在实际项目中节省时间的有用工具！
复制链接

扫一扫