gpu 编程简介

最新推荐文章于 2024-05-18 18:17:38 发布

xuzhonghai

最新推荐文章于 2024-05-18 18:17:38 发布

阅读量1.1w

点赞数 3

分类专栏： Shader GPU 文章标签：编程 shader 语言图形 direct3d structure

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuzhonghai/article/details/7240127

版权

Shader 同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

一目前最新的可编程图形硬件已经具备了如下功能：

1 支持vertex programmability 和fragment programmability

2 支持IEEE32 位浮点运算

3 支持4 元向量，4 阶矩阵计算

4 提供分支指令，支持循环控制语句

5 具有高带宽的内存传输能力（>27.1GB/s）

6 支持1D、2D、3D 纹理像素查询和使用，且速度极快

7 支持绘制到纹理功能（Render to Texture，RTT）

二、GPU和CPU

nGPU 具有高并行结构（highly parallel structure），所以GPU 在处理图形数据和复杂算法方面拥有比CPU 更高的效率

gPU 采用流式并行计算模式，可对每个数据进行独立的并行计算（流内任意元素的计算不依赖于其它同类型数据）

CPU 和GPU 上的代码比较：提取2D 图像上每个像素点的颜色值

三、GPU 图形绘制管线

图形绘制管线可分为三个主要阶段

–应用程序阶段，使用高级编程语言（C、C++、JAVA 等）进行开发，主要和CPU、内存打交道，诸如碰撞检测、场景图建立、空间八叉树更新、视锥裁剪等经典算法都在此阶段执行

–几何阶段，主要负责顶点坐标变换、光照、裁剪、投影以及屏幕映射，该阶段基于GPU 进行运算，在该阶段的末端得到了经过变换和投影之后的顶点坐标、颜色、以及纹理坐标

–光栅阶段，基于几何阶段的输出数据，为像素（Pixel）正确配色，以便绘制完整图像，，每个像素的信息存储在颜色缓冲器（color buffer 或者frame buffer）中

四、Shade Language（着色语言）

shader language 被定位为高级语言，如，GLSL 的全称是“High Level ShadingLanguage”，Cg 语言的全称为“C for Graphic”，并且这两种shader language 的语法设计非常类似于C 语言。

高级语言的一个重要特性是“独立于硬件”，但是目前shader language 完全依赖于GPU 构架，

任意一种shader language 都必须基于图形硬件，所以GPU 编程技术的发展本质上还是图形硬件的发展。在shader language存在之前，展示基于图形硬件的编程能力只能靠低级的汇编语言。

使用shader language 编写的程序称之为shader program（着色程序）。着色程序分为两类：

–vertex shader program（顶点着色程序，运行在顶点处理器上）

–fragment shader program（片断着色程序，运行在片段处理器上）

Vertex Shader Program

顶点着色程序从GPU 前端模块（寄存器）中提取图元信息（顶点位置、法向量、纹理坐标等），并完成顶点坐标空间转换、法向量空间转换、光照计算等操作，最后将计算好的数据传送到指定寄存器中；

然后片断着色程序从中获取需要的数据，通常为“纹理坐标、光照信息等”，并根据这些信息以及从应用程序传递的纹理信息（如果有的话）进行每个片断的颜色计算，最后将处理后的数据送光栅操作模块。

Fragment Shader Program

片断就是所有的三维顶点在光栅化之后的数据集合，这些数据还没有经过深度值比较

片断着色程序对每个片断进行独立的颜色计算，最后输出颜色值的就是该片段最终显示的颜色。可以这样说，顶点着色程序主要进行几何方面的运算，而片段着色程序主要针对最终的颜色值进行计算。

Shader language 目前有3 种主流语言：

–基于OpenGL 的GLSL（OpenGLShading Language，也称为GLslang）

–基于Direct3D 的HLSL（High Level ShadingLanguage）语言，

–NVIDIA 公司的Cg （C for Graphic）语言。

http://blog.csdn.net/xuzhonghai/article/details/7240127

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
gpu 编程简介

一目前最新的可编程图形硬件已经具备了如下功能：1 支持vertex programmability 和fragment programmability2 支持IEEE32 位浮点运算 3 支持4 元向量，4 阶矩阵计算 4 提供分支指令，支持循环控制语句 5 具有高带宽的内存传输能力（>27.1GB/s）6 支持1D、2D、3D 纹理像素查询和使用，且
复制链接

扫一扫

专栏目录

xuzhonghai CSDN认证博客专家 CSDN认证企业博客

码龄16年

30: 原创

24万+: 周排名

224万+: 总排名

15万+: 访问

: 等级

1901: 积分

40: 粉丝

35: 获赞

7: 评论

18: 收藏

私信

关注

热门文章

分类专栏

算法研究 3篇
脚本学习 14篇
C#学习 3篇
游戏引擎 20篇
C++学习 14篇
GPU 1篇
Shader 1篇
开发牢骚
架构学习 3篇
调试工具 1篇

最新评论

内存碎片
生活的苦涩: 不错，有空慢慢看..
lua_gc源码学习一
青蛙跳井卟咚卟咚: 楼主转了云风的博客都不带注释源地址的和原作者的啊，有个说明别人看到了不就不用看重复内容了么
大体了解Lua的语法
xuzhonghai: Account = { balance = 0} function Account:new(o) o = o or {} setmetatable(o,self) self.-Index = self return o end
内存碎片
herm_lib: memcached这种对使用内存的方案搞得不错，但确实有特有的缺点。如果业务特点允许的话，可以考虑为每个逻辑对象启用一个内存的Allocator。文章是原创吗？我能转载这个文章吗？
NiRenderFrame
xuzhonghai 回复工程师WWW: 是公司的gb引擎文档 3.1版sdk。没有连接

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。