John carmark在idtech6 ,光线追踪,物理的谈话 第二部分

原文地址 
https://www.pcper.com/reviews/G
raphics-Cards/John-Carmack-id-Tech-6-Ray-Tracing-Consoles-Physics-and-more/Multi-GPU-graphi
多GPU图形和结论

PCPER:您对多GPU系统目前的情况有何看法?你认为这是一个真正的好处,

你认为开发人员能够轻松地利用这些硬件配置吗?

CARMACK:从开发人员的角度来看,令人不安的事实是,

控制台功能真的主宰了今天的发展决策。

如果你看现在的标题和他们在控制台上的做法,

你知道,高端行动基于GPU的东西,控制台是如此主要的因素,

很难设置,

所以你可以做很多事情来利用真正的极端的高端桌面设置。

传统上你会得到更多的分辨率,一个控制台游戏可能设计为720p,

高端的PC你可以运行1080p甚至更高的分辨率,这是一件明显的事情。

你启动了分辨率。

当您有1GB的视频内存可用时,您关闭压缩。

通常情况下,您可以从30 Hz的控制台游戏到60 Hz的PC游戏。 


 

PCPER:你认为NVIDIA和AMD是否太依赖于多GPU技术,

而不是推出真正的下一代GPU?多GPU系统是否仍然可以选择?

CARMACK:我一直是这些高端精品系统的大支持者 -
从3dfx的早期开始,我一直以为这是一个真正的羽毛,(翻译可能有误!)
他们可以付出更多的钱,拥有更大的系统,有它的双倍,只是走得更快。
我认为这是一个非常好的选择,肯定像NVIDIA和AMD这样的公司
正在投入所有可能的资源来制造更新的下一代显卡。
但是,为了能够拥有这样的能力,只需要付出更多的钱,
并从当前一代获得更多的表现是非常有用的事情。
游戏拥有这些一千美元的显卡是否有意义,这是非常有争议的,
但它对开发人员来说真的很好。 
为了能够瞄准三年后即将出现的高端产品,
今天能够支付更多的钱,增加2倍的功率。
当然,整个高端仿真业务从可扩展图形商品化中受益匪浅。

尽管在这方面很清楚,几年前,当一切都以一种相当简单的算法方法进行,

就像您刚刚渲染到帧缓冲区的图形引擎一样,

它们很容易前进,并将该帧缓冲区块任意数量的片断。

但是,现在图形渲染和GPU之间的耦合要更加紧密,

那里有各种各样的反馈,

渲染到子缓冲区,来回移动,获得依赖的条件查询结果,

这使得它变得更难这样的问题。

但这是从一开始就是多处理的全部故事; 我们正在与多个CPU进行战斗。

这是提高计算性能的主要问题。


 

这是我很大的收获消息,很多人关于即将到来的一代通用计算GPU;
 很多人似乎不太清楚顶点片段光栅化方法如何计算机图形
无疑是最成功的多处理解决方案。
如果您回顾了40多年的研究,以及人们在尝试使用多个处理器来解决问题的过程中
所做的工作,
事实上,我们可以使用顶点片段模型轻松实现这一点,这实际上证明了它的价值。
很多人只是认为“哦,当然我希望有更多的灵活性,
我希望有多个CPU可以做所有这些不同的事情”,
还有很多人不太了解那些痛苦会像我们一样走过去 这当然正在进行
,因为软件试图移动的东西,而不是“只是你的应用程序的线程”。
任何人说这是基本上是一个白痴,不赞赏这些问题。
所有这一切都有深刻的一面,从一开始就一直是   象牙塔 研究项目,这绝对没有解决。 

PCPER:NVIDIA和AMD驱动团队必须打入游戏才能使其在 多GPU系统上获得最佳效果,

而且今天比以往更难。你认为开发人员对控制台市场的依赖,

这是今天单GPU的一个原因呢?

CARMACK:这可能使PC卡家伙变得更加困难,
因为开发人员随着我们在控制台上的低级访问而变得越来越复杂,
渲染引擎变得越来越难,
在后台自动分割成多个GPU。
我们在单GPU上做更复杂的事情 -
有更多的数据传输来回传递,更新的状态必须 被 复制 到 多个GPU,
屏幕的相关部分做不同的事情。它仍然是可能的,
但它是一种毛茸茸的工作, (翻译也可能有误!)
我绝对不会羡慕那些司机作家或他们的任务。

PCPER:来自AMD和NVIDIA的3-4个GPU系统的任何想法?矫枉过正?

CARMACK:对于许多应用程序,对于那些仅仅处理像笨帧缓冲区的应用程序,

他们真的会提前4倍,特别是如果你只是想在那里的4倍的分辨率,

这很简单。毫无疑问,如果您以一定的分辨率拍摄要以帧速率播放的游戏,

则4核 GPU解决方案通常能够前进并渲染4x像素,

或者非常接近线性缩放。 


 

但是,不可能做的是以给定的名义分辨率运行20 FPS的游戏,
然后使该游戏运行60 FPS。您可能会遇到不是原始GPU吞吐量的东西,
通常是游戏中的CPU吞吐量。

PCPER:您已经选择了AGEIA尝试使用硬件物理插件卡的单词。现在,他们已经离开现场,由NVIDIA购买,你对过去的情况有什么想法?

CARMACK:这是从一开始就是一个愚蠢计划的事情之一,我真的希望NVIDIA没有付出太多的代价,因为我发现整个事情是虚伪的。许多人从一开始就表示,他们的整个业务战略是被收购的,
因为对于每个人来说,附加物理卡的市场不是那么明显。市场证明不是在那里。关于建立一家公司,
基本上是向消费者说谎的事情,这是一个好主意,
为了从一家大公司出钱出售,我看到整个事情都非常令人厌恶。
很明显,我们知道AGEIA开始的时候,
几代人将在GPU上拥有这些通用的计算资源。
而现在我们现在就是可以实现物理学的CUDA,
你现在不能很好地混合搭配,
这样重的系统会改变,但将来的版本会变得更好。
最终,您将使用一组可以运行通用数据并行的资源与非常高效的光栅化工作的资源。
至于PhysX硬件,虽然他们会有一点谈论他们的架构如何在某种程度上更适合物理处理,
而且它可能会更适合,因为它从来没有告诉任何人如何或为什么。
最终,您将使用一组可以运行通用数据并行的资源与非常高效的光栅化工作的资源。
至于PhysX硬件,虽然他们会有一点谈论他们的架构如何在某种程度上更适合物理处理,
而且它可能会更适合,
因为它从来没有告诉任何人如何或为什么。
最终,您将使用一组可以运行通用数据并行的资源与非常高效的光栅化工作的资源。
至于PhysX硬件,虽然他们会有一点谈论他们的架构如何在某种程度上更适合物理处理,
而且它可能会更适合,因为它从来没有告诉任何人如何或为什么。

PCPER:你认为将物理学移动到GPU是一个好处吗?

CARMACK:现在,要卸载这样的任务,你必须能够继续前进,
把它们粘在一个相当深入的管道中,
所以它不符合人们现在在他们的游戏中做物理建模的方式。
但是,随着人们选择改变架构,在物理碰撞检测的报告中允许一帧延迟,
或者我们得到更精细的粒度并行化,
你没有这么长的延迟时间,你可以强制立即模式调用对GPU操作,
然后我们开始使用这些方式,我们执行SSE指令或我们当前的代码库中的某些东西。
那么,是的,我们绝对会用这样的 计算资源 或 碰撞检测物理学。 

PCPER:NVIDIA有Novodex,英特尔有Havok - 会在市场上造成碎片吗?

你认为微软将它们组合成物理API,就像DirectX一样吗?

CARMACK:看到播放效果会很有趣,因为当我在微软的图形API方面遇到一些问题时,

我非常了解,我真的认为微软最终得到DX9类的好处,

有一个非常聪明的标准,每个人都被迫遵守。这是一件好事。

但当然,我担心这个一般的计算主题,

因为如果MS花了9个尝试来取得正确的...好的。

他们现在可能对这个整个过程有一些积累的智慧,

但总是有机会让 MS 超越  他们的  实际经验,并制定一个不好的标准。

他们的标准几乎总是演变成好东西,

如果他们在DX计算的第一步得到正确的话,  或任何它将要。

(原文我删除了一句,大致意思,我猜测应该是“我太激动.......”翻译可能有误!!! 应该意思是“很激动吧??”),因为这真的是所有这一切仍在研究。

有了图形,我们真的是在很大程度上遵循SGI模型很长一段时间,

给了行业一个真正的腿。(翻译可能有误! )

现在,这回到了前面的一点:每个人仍然在为我们在这里做的奇妙的事情挥霍手,

但我们真的没有这些例子更不用说应用程序了。

所以当实际上并没有那么多经验的基础时,进入并开始制定具体标准是一个危险的时刻。

现在,这回到了前面的一点:每个人仍然在为我们在这里做的奇妙的事情挥霍手,

但我们真的没有这些例子更不用说应用程序了。

所以当实际上并没有那么多经验的基础时,

进入并开始制定具体标准是一个危险的时刻。

现在,这回到了前面的一点:每个人仍然在为我们在这里做的奇妙的事情挥霍手,

但我们真的没有这些例子更不用说应用程序了。

所以当实际上并没有那么多经验的基础时,

进入并开始制定具体标准是一个危险的时刻。

就物理API而言,我确实希望任何一个API可以帮助广泛的游戏开发者支持,
无论是去 Novodex  还是  Havok,他们都必须有后端,至少可以使用任何加速技术。
只是显而易见的是,英特尔显然不会使CUDA的实现速度非常快,
但是有些人会因为它至少具有与插头兼容的CUDA实现。
也许NVIDIA将最终为其API提供封装。但这只是今天发展的现实。
除非您是Microsoft技术开发人员或与Xbox 360平台相关的内容,
否则开发人员将无法选择“我们将使用英特尔的东西,而不是在当前控制台一代运行”。
这只是不会发生的。 
结论与分析

在这里有很多信息要与约翰谈话


永远不会失望。我们来试试几分钟,


总结一下他的评论在射线


跟踪,控制台,物理等方面的反映。

第一点分析是关于光线跟踪的讨论; 约翰显然觉得 英特尔 目前在使用


传统光线跟踪算法进行游戏的方式不可能赢得下一代渲染技术。

这对英特尔来说显然不是一个好消息,因为尽管约翰不是唯一的游戏编程天才,

但他的看法似乎比行业内的任何人都更重要。

约翰或多或少地回答了柯克博士认为,光栅化具有太多的天生性能优势,

可以通过光线跟踪来处理。

无论英特尔成功地 将 Larrabee架构 拉伸到令人难以置信的性能水平。 




 

约翰确实看到 光线跟踪  有用 的 是


他创建的一个非常 具体 的 数据模型,称为 “稀疏体素八度”,

允许他以 使用光线跟踪方法 轻松访问  的 方式 存储  大量数据。

这并不意味着约翰认为使用这些光线直接进行渲染,

只是光线跟踪的理论和算法对于他的具体目的是有用的。 

根据John的说法,针对id Tech 6的这种新的数据模型和算法

将允许在世界上几乎无限量的几何细节,没有在镶嵌引擎中看到的问题,

或试图在本地存储千兆字节的数据。


虽然我们要求一些图表或截图,可能会显示约翰指的是什么样的细节


,但我们还没有得到任何东西;    这是预期这个早期的发展。



 

约翰的意见认为,任何新技术都需要采用概念验证,

与 我 关于 英特尔 为 Havok  和 Project Offset   等公司花钱的理论一致。

他们需要创建一个演示或引擎,使人们跳起来,让人印象深刻,

以保证新的硬件和软件设计。

英特尔只是在光线跟踪上展示了上一代媒体,因此还没有引起整个软件界的关注。

然而约翰说,他计划在今年的某个时候,

使用稀疏体素八叉树方法来证明自己的技术及其好处。


 

John和David Kirk也认为,混合和匹配传统光栅化渲染与光线跟踪不仅是可能的,

但很可能尽管英特尔团队以前讨论过一些保留。

不仅如此,作为一个现代化的 控制台和  移动开发者,

John 完全不理会 将 光线跟踪引擎 移动到 便携式设备 或 UMPC, 成为一个“荒谬的论据”。 

约翰和我讨论了多GPU系统的状况。

随着NVIDIA和AMD正在使用两台,三台甚至四台GPU计算机的推动约翰认为,

在某些情况下,游戏引擎简单易用,可以轻松地将其切片,

能够将功能的两倍或两倍一个系统至少对开发人员来说非常棒。

当麻烦来的,虽然是引进DX9C和DX10,拥有的功能,

如反馈,子缓冲器和条件查询,切片为多个GPU来  地址 的 工作 越来越困难得多。

开发人员将控制台和端口重点放在PC上,

而不是反之亦然,这也是许多人认为PC游戏减少的原因。

由于开发人员在财务上需要瞄准 PS3 和 Xbox 360  的 更大 和 更有利可图的受众群体,

因此花费大量时间或金钱来改变媒体或算法是没有意义的,

以利用高端PC可以提供的额外功率。

约翰说,在PC上提高分辨率和帧速率是很容易的,

但真正改变PC市场的东西对开发人员来说并不是很有意义。 

我想感谢约翰·卡马克(John Carmack)  花时间  与我谈论这些话题,

希望我们的读者将这些信息看作是革命性的,像我 一样 激动人心。

在和约翰谈话时总是这样,你会在短时间内获得很多奇妙的信息,


并花时间消化他在这里所发表的一切,这可能需要比这篇文章更长的时间。 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值