GPU编程中UMA的作用及限制

1. UMA和hUMA

传统的UMA由于CPU和GPU各自cache的独立性,如果不能很好的处理cache同步,那么轻则访问速度变慢,重则数据出错。AMD提出的hUMA解决了这一问题,保证了cache层的数据一致性

2. UMA的限制

  • UMA不解决读回的速度慢的问题。读回渲染结果的三件事情:同步->拷贝->untile。由于PCIe是对称的,所以重点问题一般出在同步上。
  • UMA不能显著地提升性能。如前所述,在硬件支持hUMA且可以渲染untile数据的前提下才能节省拷贝的时间,即便如此,拷贝所占时间很少,所以不能显著提升性能

转载于:https://www.cnblogs.com/derekxyw/p/7600824.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值