显卡达人修炼计划 [完成篇]

最新推荐文章于 2022-12-02 23:33:44 发布

xinwangchao

最新推荐文章于 2022-12-02 23:33:44 发布

阅读量2k

点赞数

文章标签： express 游戏图形 shader windows 产品

转载来自： http://bbs.zol.com.cn/index20070219/index_257_11247.html http://bbs.zol.com.cn/index20070219/index_257_11247.html

API篇
首先解释下API：是 Application Programming Interface应用程序接口的缩写，是许多程序的大集合。3D API能让编程人员所设计的3D软件只要调用其API内的程序，从而让API自动和硬件的驱动程序沟通，启动3D芯片内强大的3D图形处理功能，从而大幅度地提高了3D程序的设计效率。目前普遍应用的3D API有DirectX、OpenGL、Glide、Heidi。

[1.1]  OpenGL

OpenGL是个专业的3D程序接口，是一个功能强大，调用方便的底层3D图形库。OpenGL的前身是SGI公司为其图形工作站开发的IRIS GL。IRIS GL是一个工业标准的3D图形软件接口，功能虽然强大但是移植性不好，于是SGI公司便在IRIS GL的基础上开发了OpenGL。OpenGL的英文全称是“Open Graphics Library”，顾名思义，OpenGL便是“开放的图形程序接口”。虽然DirectX在家用市场全面领先，但在专业高端绘图领域，OpenGL是不能被取代的主角。

OpenGL是个与.硬件无关的软件接口，可以在不同的平台如Windows 95、Windows NT、Unix、Linux、MacOS、OS／2之间进行移植。因此，支持OpenGL的软件具有很好的移植性，可以获得非常广泛的应用。由于OpenGL是3D图形的底层图形库，没有提供几何实体图元，不能直接用以描述场景。但是，通过一些转换程序，可以很方便地将AutoCAD、3DS等3D图形设计软件制作的DFX和3DS模型文件转换成OpenGL的顶点数组。

在OpenGL的基础上还有Open Inventor、Cosmo3D、Optimizer等多种高级图形库，适应不同应用。其中，Open Inventor应用最为广泛。该软件是基于OpenGL面向对象的工具包，提供创建交互式3D图形应用程序的对象和方法，提供了预定义的对象和用于交互的事件处理模块，创建和编辑3D场景的高级应用程序单元，有打印对象和用其它图形格式交换数据的能力。

OpenGL的发展一直处于一种较为迟缓的态势，每次版本的提高新增的技术很少，大多只是对其中部分做出修改和完善。1992年7月，SGI公司发布了OpenGL的1.0版本，随后又与微软公司共同开发了Windows NT版本的OpenGL，从而使一些原来必须在高档图形工作站上运行的大型3D图形处理软件也可以在微机上运用。1995年OpenGL的1.1版本面市，该版本比1.0的性能有许多提高，并加入了一些新的功能。其中包括改进打印机支持，在增强元文件中包含OpenGL的调用，顶点数组的新特性，提高顶点位置、法线、颜色、色彩指数、纹理坐标、多边形边缘标识的传输速度，引入了新的纹理特性等等。OpenGL 1.5又新增了“OpenGL Shading Language”，该语言是“OpenGL 2.0”的底核，用于着色对象、顶点着色以及片断着色技术的扩展功能。

OpenGL 2.0标准的主要制订者并非原来的SGI，而是逐渐在ARB中占据主动地位的3Dlabs。2.0版本首先要做的是与旧版本之间的完整兼容性，同时在顶点与像素及内存管理上与DirectX共同合作以维持均势。OpenGL 2.0将由OpenGL 1.3的现有功能加上与之完全兼容的新功能所组成(如图一)。借此可以对在ARB停滞不前时代各家推出的各种纠缠不清的扩展指令集做一次彻底的精简。此外，硬件可编程能力的实现也提供了一个更好的方法以整合现有的扩展指令。

目前，随着DirectX的不断发展和完善，OpenGL的优势逐渐丧失，至今虽然已有3Dlabs提倡开发的2.0版本面世，在其中加入了很多类似于DirectX中可编程单元的设计，但厂商的用户的认知程度并不高，未来的OpenGL发展前景迷茫。

[1.2  ]DirectX

DirectX 并不是一个单纯的图形API，它是由微软公司开发的用途广泛的API，它包含有Direct Graphics(Direct 3D+Direct Draw)、Direct Input、Direct Play、Direct Sound、Direct Show、Direct Setup、Direct Media Objects等多个组件，它提供了一整套的多媒体接口方案。只是其在3D图形方面的优秀表现，让它的其它方面显得暗淡无光。DirectX开发之初是为了弥补Windows 3.1系统对图形、声音处理能力的不足，而今已发展成为对整个多媒体系统的各个方面都有决定性影响的接口。

DirectX 1.0
第一代的DirectX很不成功，推出时众多的硬件均不支持，当时基本都采用专业图形API－OpenGL，缺乏硬件的支持成了其流行的最大障碍。
DirectX 1.0版本是第一个可以直接对硬件信息进行读取的程序。它提供了更为直接的读取图形硬件的性能（比如：显示卡上的块移动功能）以及基本的声音和输入设备功能（函数），使开发的游戏能实现对二维（2D）图像进行加速。这时候的DirectX不包括现在所有的3D功能，还处于一个初级阶段。

DirectX 2.0
DirectX 2.0在二维图形方面做了些改进，增加了一些动态效果，采用了Direct 3D的技术。这样DirectX 2.0与DirectX 1.0有了相当大的不同。在DirectX 2.0中，采用了“平滑模拟和RGB模拟”两种模拟方式对三维(3D)图像进行加速计算的。DirectX 2.0同时也采用了更加友好的用户设置程序并更正了应用程序接口的许多问题。从DirectX 2.0开始，整个DirectX的设计架构雏形就已基本完成。

DirectX 3.0
DirectX 3.0的推出是在1997年最后一个版本的Windows95发布后不久，此时3D游戏开始深入人心，DirectX也逐渐得到软硬件厂商的认可。97年时应用程序接口标准共有三个，分别是专业的OpenGL接口，微软的DirectX D接口和3DFX公司的Glide接口。而那时的3DFX公司是最为强大的显卡制造商，它的Glide接口自然也受到最广泛的应用，但随着3DFX公司的没落，Voodoo显卡的衰败，Glide接口才逐渐消失了。

DirectX 3.0是DirectX 2.0的简单升级版，它对DirectX 2.0的改动并不多。包括对DirectSound（针对3D声音功能）和DirectPlay（针对游戏/网络）的一些修改和升级。DirectX 3.0集成了较简单的3D效果，还不是很成熟。

DirectX 5.0
微软公司并没有推出DirectX 4.0，而是直接推出了DirectX 5.0。此版本对Direct3D做出了很大的改动，加入了雾化效果、Alpha混合等3D特效，使3D游戏中的空间感和真实感得以增强，还加入了S3的纹理压缩技术。
同时，DirectX 5.0在其它各组件方面也有加强，在声卡、游戏控制器方面均做了改进，支持了更多的设备。因此，DirectX发展到DirectX 5.0才真正走向了成熟。此时的DirectX性能完全不逊色于其它3D API，而且大有后来居上之势。

DirectX 6.0
DirectX 6.0推出时，其最大的竞争对手之一Glide，已逐步走向了没落，而DirectX则得到了大多数厂商的认可。DirectX 6.0中加入了双线性过滤、三线性过滤等优化3D图像质量的技术，游戏中的3D技术逐渐走入成熟阶段。

DirectX 7.0
DirectX 7.0最大的特色就是支持T&L，中文名称是“坐标转换和光源”。3D游戏中的任何一个物体都有一个坐标，当此物体运动时，它的坐标发生变化，这指的就是坐标转换；3D游戏中除了场景＋物体还需要灯光，没有灯光就没有3D物体的表现，无论是实时3D游戏还是3D影像渲染，加上灯光的3D渲染是最消耗资源的。虽然OpenGL中已有相关技术，但此前从未在民用级硬件中出现。

在T& L问世之前，位置转换和灯光都需要CPU来计算，CPU速度越快，游戏表现越流畅。使用了T&L功能后，这两种效果的计算用显示卡的GPU来计算，这样就可以把CPU从繁忙的劳动中解脱出来。换句话说，拥有T&L显示卡，使用DirectX 7.0，即使没有高速的CPU，同样能流畅的跑3D游戏。

DirectX 8.0
DirectX 8.0的推出引发了一场显卡革命，它首次引入了“像素渲染”概念，同时具备像素渲染引擎(Pixel Shader)与顶点渲染引擎(Vertex Shader)，反映在特效上就是动态光影效果。同硬件T&L仅仅实现的固定光影转换相比，VS和PS单元的灵活性更大，它使GPU真正成为了可编程的处理器。这意味着程序员可通过它们实现3D场景构建的难度大大降低。通过VS和PS的渲染，可以很容易的宁造出真实的水面动态波纹光影效果。此时 DirectX的权威地位终于建成。

DirectX 9.0
2002年底，微软发布DirectX9.0。DirectX 9中PS单元的渲染精度已达到浮点精度，传统的硬件T&L单元也被取消。全新的VertexShader(顶点着色引擎)编程将比以前复杂得多，新的VertexShader标准增加了流程控制，更多的常量，每个程序的着色指令增加到了1024条。

PS 2.0具备完全可编程的架构，能对纹理效果即时演算、动态纹理贴图，还不占用显存，理论上对材质贴图的分辨率的精度提高无限多；另外PS1.4只能支持 28个硬件指令，同时操作6个材质，而PS2.0却可以支持160个硬件指令，同时操作16个材质数量，新的高精度浮点数据规格可以使用多重纹理贴图，可操作的指令数可以任意长，电影级别的显示效果轻而易举的实现。

VS 2.0通过增加Vertex程序的灵活性，显著的提高了老版本(DirectX8)的VS性能，新的控制指令，可以用通用的程序代替以前专用的单独着色程序，效率提高许多倍；增加循环操作指令，减少工作时间，提高处理效率；扩展着色指令个数，从128个提升到256个。

增加对浮点数据的处理功能，以前只能对整数进行处理，这样提高渲染精度，使最终处理的色彩格式达到电影级别。突破了以前限制PC图形图象质量在数学上的精度障碍，它的每条渲染流水线都升级为128位浮点颜色，让游戏程序设计师们更容易更轻松的创造出更漂亮的效果，让程序员编程更容易。

显卡所支持的DirectX版本已成为评价显卡性能的标准，从显卡支持什么版本的DirectX，用户就可以分辨出显卡的性能高低，从而选择出适合于自己的显卡产品。

第二部分术语解析：
[2.1]  RAMDAC
　　RAMDAC是Random Access Memory Digital/Analog Convertor的缩写，即随机存取内存数字～模拟转换器。RAMDAC作用是将显存中的数字信号转换为显示器能够显示出来的模拟信号，其转换速率以MHz表示。
　　计算机中处理数据的过程其实就是将事物数字化的过程，所有的事物将被处理成 0和 1两个数，而后不断进行累加计算。图形加速卡也是靠这些0和1对每一个象素进行颜色、深度、亮度等各种处理。显卡生成的信号都是以数字来表示的，但是所有的CRT显示器都是以模拟方式进行工作的，数字信号无法被识别，这就必须有相应的设备将数字信号转换为模拟信号。而RAMDAC就是显卡中将数字信号转换为模拟信号的设备。
　　RAMDAC的转换速率以MHz表示，它决定了刷新频率的高低（与显示器的“带宽”意义近似）。其工作速度越高，频带越宽，高分辨率时的画面质量越好.该数值决定了在足够的显存下，显卡最高支持的分辨率和刷新率。如果要在1024×768的分辨率下达到85Hz的分辨率， RAMDAC的速率至少是1024×768×85×1.344÷1.06≈90MHz。
　　目前主流的显卡RAMDAC都能达到350MHz和400MHz，已足以满足和超过目前大多数显示器所能提供的分辨率和刷新率。

[2.2] S端子
S—Video的简称，视频信号专用输入输出接口。可用于输出视频信号至电视，S端子采用亮度和色度分离输出设计，克服了视频节目复合输出时的亮度和色度的互相干扰，提供较高清晰度的输出效果。

[2.3]  T&L
T& L（Transform and Lighting，变形与光源处理），nVidia公司为提高显示质量而研究出来的一种技术，可以取代在3D图像处理过程中，原来由CPU负责的"几何转换"（Transform）和"光照处理"（Lighting）处理过程，消除CPU瓶颈对电脑3D图像处理性能的限制。同时，显卡的硬件T&L 有更强大的多边形生成和"光照处理"能力，能使3D游戏中的人物和光影场景更真实能。

[2.4] 多边形生成率
3D芯片每秒能画出多少骨架（三角形）。由于3D贴图，效果渲染都需要在这些骨架上进行。所以多边形生成率越高，3D芯片/卡能提供的画面越细腻。
[2.5]  分辨率
显卡输出到显示器的可视信号，是由一系列的点构成的。分辨率就是指显示卡所能在显示器上描绘的点的数最，通常以"横向点数×纵向点数"表示。由于显示器呈长方形，所以一般来说水平点数大于垂直点数。例如"1024×768"，就表示在显示器上横向有1024个点，纵向有768个点。
[2.6] 接口类型
接口类型是指显卡与主板连接所采用的接口种类。显卡的接口决定着显卡与系统之间数据传输的最大带宽，也就是瞬间所能传输的最大数据量。不同的接口能为显卡带来不同的性能。，而且也决定着主板是否能够使用此显卡。只有在主板上有相应接口的情况下，显卡才能使用。显卡发展至今共出现ISA、PCI、AGP等几种接口，所能提供的数据带宽依次增加。AGP（Accelerated Graphics Port）作为接口的。AGP的意思是图形加速接口，也称AGP总线。AGP可直接向图形分支系统的存储器提供高速带宽。PCI Express是新一代的总线接口，而采用此类接口的显卡产品，已经在2004年正式面世。早在2001年的春季“英特尔开发者论坛”上，英特尔公司就提出了要用新一代的技术取代PCI总线和多种芯片的内部连接，并称之为第三代I/O总线技术。随后在2001年底，包括Intel、AMD、DELL、 IBM在内的20多家业界主导公司开始起草新技术的规范，并在2002年完成，对其正式命名为PCI Express。
PCI Express采用了目前业内流行的点对点串行连接，比起PCI以及更早期的计算机总线的共享并行架构，每个设备都有自己的专用连接，不需要向整个总线请求带宽，而且可以把数据传输率提高到一个很高的频率，达到PCI所不能提供的高带宽。相对于传统PCI总线在单一时间周期内只能实现单向传输，PCI Express的双单工连接能提供更高的传输速率和质量，它们之间的差异跟半双工和全双工类似。
　　PCI Express的接口根据总线位宽不同而有所差异，包括X1、X4、X8以及X16（X2模式将用于内部接口而非插槽模式）。较短的PCI Express卡可以插入较长的PCI Express插槽中使用。PCI Express接口能够支持热拔插，这也是个不小的飞跃。PCI Express卡支持的三种电压分别为+3.3V、3.3Vaux以及+12V。用于取代AGP接口的PCI Express接口位宽为X16，将能够提供5GB/s的带宽，即便有编码上的损耗但仍能够提供约为4GB/s左右的实际带宽，远远超过AGP 8X的2.1GB/s的带宽。
PCI Express规格从1条通道连接到32条通道连接，有非常强的伸缩性，以满足不同系统设备对数据传输带宽不同的需求。例如，PCI Express X1规格支持双向数据传输，每向数据传输带宽250MB/s，PCI Express X1已经可以满足主流声效芯片、网卡芯片和存储设备对数据传输带宽的需求，但是远远无法满足图形芯片对数据传输带宽的需求。因此，必须采用PCI Express X16，即16条点对点数据传输通道连接来取代传统的AGP总线。PCI Express X16也支持双向数据传输，每向数据传输带宽高达4GB/s，双向数据传输带宽有8GB/s之多，相比之下，目前广泛采用的AGP 8X数据传输只提供2.1GB/s的数据传输带宽。
尽管PCI Express技术规格允许实现X1（250MB/秒），X2，X4，X8，X12，X16和X32通道规格，但是依目前形式来看，PCI Express X1和PCI Express X16将成为PCI Express主流规格，同时芯片组厂商将在南桥芯片当中添加对PCI Express X1的支持，在北桥芯片当中添加对PCI Express X16的支持。除去提供极高数据传输带宽之外，PCI Express因为采用串行数据包方式传递数据，所以PCI Express接口每个针脚可以获得比传统I/O标准更多的带宽，这样就可以降低PCI Express设备生产成本和体积。另外，PCI Express也支持高阶电源管理，支持热插拔，支持数据同步传输，为优先传输数据进行带宽优化。
在兼容性方面，PCI Express在软件层面上兼容目前的PCI技术和设备，支持PCI设备和内存模组的初始化，也就是说目前的驱动程序、操作系统无需推倒重来，就可以支持PCI Express设备。

[2.7]色深
色深（Color Depth），也称之为色位深度，在某一分辨率下，每一个像素点可以有多少种色彩来描述，它的单位是“bit”(位)。典型的色深是8-bit、16-bit、24-bit和32-bit。深度数值越高，可以获得更多的色彩。
[2.8]视频输出/输入
这类视频接口并不是必须的，它的主要作用就是将显示信号输出到外部设备上，或收集外部采集的视频信号。带有视频输出的显卡通常造价要稍高一些，而您如果根本就不需要它，那在购买的时候还是挑选不带视频输出的型号，他能够省下不少钱。
[2.9]刷新频率
图像在屏幕上更新的速度，也即屏幕上的图像每秒种出现的次数，它的单位是赫兹（Hz）。刷新频率越高，屏幕上图像闪烁感就越小，稳定性也就越高，换言之对视力的保护也越好。一般时人的眼睛、不容易察觉75Hz以上刷新频率带来的闪烁感，因此最好能将您显示卡刷新频率调到75Hz以上。要注意的是，并不是所有的显示卡都能够在最大分辨率下达到75Hz以上的刷新频率（这个性能取决于显示卡上RAMDAC的速度），而且显示器也可能因为带宽不够而不能达到要求。

[2.10] 显存
显示卡的主芯片在整个显示卡中的地位固然重要，但显存的大小与好坏也直接关系着显示卡的性能高低。显存也存在速度的差别，显存的速度直接关系到显示卡的整体性能。使用相同芯片的显示卡，显存越快，显示卡的速度也就越快。
[2.11] 像素填充率
即每秒钟显示芯片/卡能在显示器上画出的点的数量。像素填充率的最大值为3D时钟乘以渲染途径的数量。如NVIDIA的GeForce 2 GTS芯片，核心频率为200 MHz，4条渲染管道，每条渲染管道包含2个纹理单元。那么它的填充率就为4x2像素x2亿/秒=16亿像素/秒。

[2.12] DVI  　　DVI全称为Digital Visual Interface，它是1999年由Silicon Image、Intel（英特尔）、Compaq（康柏）、IBM、HP（惠普）、NEC、Fujitsu（富士通）等公司共同组成DDWG （Digital Display Working Group，数字显示工作组）推出的接口标准。它是以Silicon Image公司的PanalLink接口技术为基础，基于**S（Transition Minimized Differential Signaling，最小化传输差分信号）电子协议作为基本电气连接。**S是一种微分信号机制，可以将象素数据编码，并通过串行连接传递。显卡产生的数字信号由发送器按照**S协议编码后通过**S通道发送给接收器，经过解码送给数字显示设备。一个DVI显示系统包括一个传送器和一个接收器。传送器是信号的来源，可以内建在显卡芯片中，也可以以附加芯片的形式出现在显卡PCB上；而接收器则是显示器上的一块电路，它可以接受数字信号，将其解码并传递到数字显示电路中，通过这两者，显卡发出的信号成为显示器上的图象。
　　目前的DVI接口分为两种，一个是DVI-D接口，只能接收数字信号，接口上只有3排8列共24个针脚，其中右上角的一个针脚为空。不兼容模拟信号。
　　另外一种则是DVI-I接口，可同时兼容模拟和数字信号。兼容模拟幸好并不意味着模拟信号的接口D-Sub接口可以连接在DVI-I接口上，而是必须通过一个转换接头才能使用，一般采用这种接口的显卡都会带有相关的转换接头。
　　显示设备采用DVI接口具有主要有以下两大优点：
一、速度快
　　DVI传输的是数字信号，数字图像信息不需经过任何转换，就会直接被传送到显示设备上，因此减少了数字→模拟→数字繁琐的转换过程，大大节省了时间，因此它的速度更快，有效消除拖影现象，而且使用DVI进行数据传输，信号没有衰减，色彩更纯净，更逼真。
二、画面清晰
　　计算机内部传输的是二进制的数字信号，使用VGA接口连接液晶显示器的话就需要先把信号通过显卡中的D/A（数字/模拟）转换器转变为R、G、B三原色信号和行、场同步信号，这些信号通过模拟信号线传输到液晶内部还需要相应的A/D（模拟/数字）转换器将模拟信号再一次转变成数字信号才能在液晶上显示出图像来。在上述的D/A、A/D转换和信号传输过程中不可避免会出现信号的损失和受到干扰，导致图像出现失真甚至显示错误，而DVI接口无需进行这些转换，避免了信号的损失，使图像的清晰度和细节表现力都得到了大大提高。

[2.13]帧率（Frames per Second）
每秒的帧数（fps）或者说帧率表示图形处理器场景时每秒钟能够更新几次。高的帧率可以得到更流畅、更逼真的动画。一般来说30fps就是可以接受的，但是将性能提升至60fps则可以明显提升交互感和逼真感，但是一般来说超过75fps一般就不容易察觉到有明显的流畅度提升了。如果帧率超过屏幕刷新率只会浪费图形处理的能力，因为显示器不能以这么快的速度更新，这样超过刷新率的帧率就浪费掉了。

[2.14]深度复杂性(Depth Complexity)
深度复杂性是用来度量场景复杂程度的指标。它指每个显示帧处理过程中像素需要渲染的次数。举例来说，，在场景中仅有一面墙的情况下，深度复杂性为1。如果墙的前面站有一个人则深度复杂性为2，如果有一只狗在人和墙的中间则深度复杂性为3，以此类推。深度复杂性的存在需要更强的渲染能力以及带宽以对像素进行渲染。当前图形应用程序中平均浓度复杂性大约在2到3之间，这意味着你看见的每一个像素实际上被图形处理器渲染了两到三次。

[2.15]纹理贴图(Texture Mapping)
纹理贴图是将2D图形（通常是位图）蚋射到3D物体上的一种技术。纹理贴图可以在不增加多边性数量的情况下大大提升真实视觉效果。因为它可以大大增强真实感觉同时只需要不高的计算能力的开销就可以得到，因此它是最常用的用来表现真实感3D物体的技术方法。为了渲染带有纹理贴图的像素，这个像素的纹理数据会读进图形处理器中，从而导致存储带宽的消耗。

[2.16]填充率[补充]（Fill Rate）
填充率是指像素写入显示帧缓冲区的速率。填充率是用来度量当前3D图形处理器的像素处理性能的最常用指标。填充率通常采用每秒百万像素的方式表达 (Mpixels/sec)。在1997年，50-70Mpixels/sec的填充率就是较高的水平了，但是到了2002年，领先的图形处理器可以达到超过1200Mpixels/sec的能力。这种改进可以说是令人难以置信的，但这仅仅刚刚能够满足创建引人注目的3D场景的需要。以如此高的填充率渲染像素需要消耗大量的存储带宽。

[2.17]T－buffer
T-buffer在硬件上完全支持全屏幕抗锯齿，即使在640×480这种相对较低的分辨率下也能得到最佳的显示效果。T-buffer是显卡用来提高图像质量的重要措施，而配合强劲的显示芯片和高频率CPU，这些特效可以全部打开，并获得更精细的画面。T-buffer由四个部分组成：一是"景深处理 "，这个特效可以加强3D画面的层次感，比如说视线由清晰到模糊的过程及与之相反的变化；二是"全屏幕抗锯齿"；三是"动态模糊效果"；四是"反射与柔和阴影，其实质是光影效果的处理。

[2.18] FSAA 全称是Full Screen AntiAliasing，中文名称叫做全屏幕抗失真。它的最主要的作用就是能够通过芯片内部的特别处理电路或者软件的转换，使游戏画面中的3D物体和场景中失真的像素尽量减到最低的程度来达到平滑的效果。

[2.19] Bump Mapping
Bump Mapping（凹凸贴图）是一种在3D场景中模拟粗糙外表面的技术，它用来表现轮胎、水果等物品的3D表面时特别有用。如果没有完整的凹凸贴图，在描述这些细节很多的物体时将是很耗费资源的事情，比如人皮肤上的皱纹，如果用传统的方法构建3D模型，然后用像素去填充，那么执行的效率就实在太低了。 Bump Mapping将深度的变化保存到一张贴图中，然后再对3D模型进行标准的混合贴图处理，即可方便的得到具有凹凸感的表面效果。

[2.20]Texture Mapping
如果没有Texture Mapping（材质贴图），3D图像将会非常的单薄，就像一层纸一样没有质感。而Texture Mapping可以把一张平面图像贴到多边形上，这样渲染出来的图像就会显得很充实。

[2.21]Vertex Shader 在构建3D图形的三角形中有三个顶点，利用这些顶点在3D场景中进行着色是很方便的事情。NVIDIA在GeForce 3显卡开始，采用了一种叫"Vertex Shader（顶点着色引擎）"的新技术，这种技术的最大特点就是"可编程性"，让设计人员可以按照自己的意愿设计出有特色的3D人物或者进行特别的光源处理，这样创造出来的3D场景才有特色，且更加真实。 13、Z－buffer
Z-buffer（Z-缓冲）的作用是用来确定3D物体间前后位置关系。对一个含有很多物体连接的较复杂的3D模型，能拥有较多的位数来表现深度感是相当重要的。有了Z-buffer 3D物体的纵深才会有层次感。

热门技术醒目-SLI技术详解
SLI的全称是Scalable Link Interface(可升级连接界面)，它是通过一种特殊的接口连接方式，在一块支持双PCI Express X16插槽(注意这里只是插槽而不一定都具有16条PCI Express Lanes)的主板上，同时使用两块同型号的PCI Express显卡，以增强系统图形处理能力。
nVIDIA的SLI技术与早先3dfx的SLI虽然缩写相同，其实已经是全新的技术，不但工作原理不同，甚至名称都不相同，3dfx的SLI(Scan Line Interleave，双扫描线交错技术)是将画面分为一条条扫描帧线(Scanline)，两块显卡对奇数帧线和偶数帧线分别渲染，然后将同时渲染完毕的帧线进行合并后写入到帧缓冲中，接下来显示器就可以显示出一幅完整的画面。而nVIDIA的SLI则有两种渲染模式：分割帧渲染模式(Scissor Frame Rendering，SFR)和交替帧渲染模式(Alternate Frame Rendering，AFR)，分割帧渲染模式是将每帧画面划分为上下两个部分，主显卡完成上部分画面渲染，副显卡则完成下半部分的画面渲染，然后副显卡将渲染完毕的画面传输给主显卡，主显卡再将它与自己渲染的上半部分画面合成为一幅完整的画面；而交替帧渲染模式则是一块显卡负责渲染奇数帧画面，而另外一块显卡则负责渲染偶数帧画面，二者交替渲染，在这种模式下，两块显卡实际上都是渲染的完整的画面，此时并不需要连接显示器的主显卡做画面合成工作。

在SLI状态下，特别是在分割帧渲染模式下，两块显卡并不是对等的，在运行工作中，一块显卡做为主卡(Master)，另一块做为副卡(Slave)，其中主卡负责任务指派、渲染、后期合成、输出等运算和控制工作，而副卡只是接收来自主卡的任务进行相关处理，然后将结果传回主卡进行合成然后输出到显示器。由于主显卡除了要完成自己的渲染任务之外，还要额外担负副显卡所传回信号的合成工作，所以其工作量要比副显卡大得多。另外，在SLI模式下，就只能连接一台显示器，并不能支持多头显示。

SLI技术也在不断的发展，最初对平台硬件有许多限制，例如必须使用完全一样的显卡(同一个厂家同一个型号的显卡，甚至显卡BIOS也必须相同)，而且在两块显卡之间还必须使用SLI桥接器，支持SLI的也只有Geforce 6800 Ultra/6800 GT和6600GT三款显示芯片等等。现在组建SLI则可以使用不同厂家的采用相同显示芯片的显卡，低速显卡可以不必使用SLI桥接器(不过性能要比使用 SLI桥接器时有所降低)，支持SLI的显示芯片也扩大到了除开Geforce 6200/6200TC之外的所有Geforce 6系列以及所有Geforce 7系列等等，不过，由于各个主板的两个PCI-E插槽的间距不是固定的，因此不同主板的SLI桥接器一般是不能替换的。

SLI 技术理论上能把图形处理能力提高一倍，在实际应用中，除了极少数测试之外，在实际游戏中图形性能只能提高30%-70%不等，在某些情况下甚至根本没有性能提高，而且目前能良好支持SLI的游戏还不太多。当然，随着驱动程序的完善，目前存在的这些问题应该能得到逐步解决。

主板芯片组根据其对两块显卡实际提供的PCI Express Lanes，支持SLI的方式也不尽相同，有采用PCI Express X16加PCI Express X4的，也有采用双PCI Express X8的，nVIDIA自己的nForce Pro 2200+nForce Pro 2050以及nForce4 SLI X16和nForce4 SLI X16 IE则实现了真正的双PCI Express X16的SLI。
第三部分：显卡后缀名详解
3.1nVidia
3.1.1.Vanta：字面意思不明，按照nVidia的说法，表示相应芯片的简化版本。只在TNT时代出现过几面。所以就不多介绍了
代表作:TNT2 Vanta

3.1.2. Pro: 字面意思就可以理解，‘加强’的意思，只要有它出现就代表着相应芯片的比较高端的版本。最初在TNT2系列有过，最后一面是出现在Geforce2系列，现在已经几乎成了ATI的专利。
代表作：TNT2 Pro,Geforce2 Pro

3.1.3. Ultra：字面意思‘激进，极端’的意思。事实也如此，在nVidia的产品中也是如此，只要后缀带了这个家伙，一定是那类芯片中最牛x的，细数NV的历代王者，基本都能看到它熟悉的身影。还有这个词的读音，很多人会发成‘ultra’但实际发音是发 ‘altra’
代表作：TNT2 Ultra,Geforce2 Ultra,GeforceFX5200Ultra,
GeforceFX5600Ultra,GeforceFX5700Ultra,GeforceFX5800Ultra
,GeforceFX5900Ultra,GeforceFX5950Ultra,Geforce6800Ultra

3.1.4. MX:字面意思无，nVida的计划中是代表平价版，大众类的意思，nVidia专用。后缀带它的卡在世面上估计占有率高高在上。
代表作：Geforce2 MX,Geforce2 MX100,Geforce2 MX200,Geforce2 MX400
Geforce4 MX420,Geforce4 MX440,Geforce4 MX440-8X,Geforce4MX460
Geforce4 MX4000

3.1.5.GTS:字面意思：‘气轮’，估计跟nVidia的说法没关系，GTS只出现在最早的Geforce2产品中，代表当时的最高端的Geforce2。当时的性能是十分恐怖的。可惜是短命英雄。
代表作：Geforce2 GTS
3.1.6.Ti: 字面意思是‘Titanium’的缩写，也就是那个太空金属 ‘钛’，在它出现的地方一般就是代表了nVidia的高端版本。在Geforce3中初现，后来又加入了Geforce2 Ti,最后在Geforce4系列中达到顶峰，大家一定不会忘记那个绝世经典-Geforce4 Ti4200
代表作：Geforce2 Ti,Geforce3 Ti200,Geforce3 Ti500,Geforce4 Ti4200,Geforce4 Ti4400
Geforce 4 Ti4600，Geforce4 Ti4200-8X

3.1.7.XT：重点要说就是这个，因为在nVidia的解释里面和ATI的解释里面是完全唱反调的，特别混淆视听，所以重点讲一下。XT按照nVidia的说法应该是降频版的意思。而在ATI的字典里面就代表了高端 ‘eXTreme’，所以nVidia这招纯粹是在戏弄ATI。
代表作：GeforceFX5600XT,GeforceFX5900XT

3.1.8. LE:意思应该是 ‘Lower Edition’的意思，ATI也用过，不知道和XT有什么区别，感觉是一样的意思，5700LE就是 5700标版停产后用它来和ATI的Radeon9550争夺市场的一款产品，性价比比较高。还有一款就是最新的6800LE了
代表作：GeforceFX5700LE，Geforce6800LE

3.1.9.ZT:字面意思不明，nVidia用来推广Doom推出之作，在XT基础上再次降频以降低价格，如果不是有6600的话，它的寿命应该会比较长了，所以它只能长叹 ‘既生瑜，何生亮’
代表作：GeforceFX5900ZT

3.1.10.GT:字面意思不明，NV最新的产品中用到的，表示芯片中介于标版和Ultra版的产品，属于比较高端的一类，个人认为是原来GTS的延续。
代表作：Geforce6600GT,Geforce6800GT

3.1.11.SE:也是一种简化版，只在Geforce4系列中用到，其降频版。很少见的
代表作：Geforce4 MX440SE，Geforce4 Ti4800SE(4600的8X版本)

3.2 ATI
3.2.1.LE:‘Lower Edition’的意思，ATI显示芯片中带有它的就表示比较低端的版本。从Radeon7500时代开始出现。
代表作：Radeon7500LE,Radeon8500LE

3.2.2．SE：廉价版本的意思。ATI的大部分芯片都有SE版本。
代表作：Radeon9200SE,Radeon9600SE.Radeon9800SE,Radeon X300SE

3.2.3．Pro：‘加强版’的意思，在该类芯片中属于高频一点的版本，是ATI后缀中不可缺少的一个部分，贯穿了ATI命名的始末。
代表作：Radeon9000Pro,Radeon9500Pro,Radeon9600Pro,Radeon9700Pro,Radeon9800Pro,
RadonX700Pro,Radeon X800Pro,Radeon X850Pro

3.2.4.XT:‘eXTreme’的意思，正好和NV的相反，ATI命名系列中现在成为了最重要的环节，基本上所有的高端都有XT字样。
代表作：Radeon9600XT,Radeon9800XT,Radeon X600XT,RadeonX700XT,
RadeonX800XT,RadeonX850XT

3.2.5．XT PE:‘eXTreme Platium Editon’有就是所谓的至尊版，有他在就代表高频率，高性能，高价格。是旗舰产品。
代表作：RadeonX800XT PE,RadeonX850XT PE

3.2.6: XL：这个....还目前是最高的版本……ATI最新推出的R430中的高频版
代表作：RadeonX800XL
第四部分显卡参数全资料图库

Click here to open new window
CTRL+Mouse wheel to zoom in/out

第五部分显卡新技术前瞻

关于物理卡和DX10
一、PhysX物理处理器的革命性推出
1、Ageia终于在游戏开发者大会(GDC)2006上正式发布了这款屡次延期的革命性产品。作为一家知识产权公司，Ageia本身不会亲自生产 PhysX加速卡，而是将该技术授权给板卡生产商代为生产。BFG和华硕将在今年晚些时候推出基于Ageia技术的物理加速卡，系统集成商也会推出采用这种加速卡的PC系统在Ageia看来，PPU是自3D加速在上世纪九十年代引入PC之后的又一次革命性进步，以往3D渲染世界中由CPU管理、GPU渲染的动态物体和材料将得到来自PPU的加速，电脑游戏也将由此进入一个新的时代

ATi的CrossFire和nVIDIA的SLI都是在多张显卡之间提供动态负载平衡，以实现物理处理能力，而Ageia的PPU则从开发之初就专著于物理处理，可以处理更大量、更复杂的动态运算，同时也能让CPU专心于任务管理、让GPU专心于帧渲染的本职任务。
Ageia表示，游戏环境中的诸多因素必须符合其现实物理特性才能让游戏更加真实，比如一辆汽车行驶在大雨弥漫的高速公路上的场景就必须表现出烟尘、水汽、雨滴等微粒与固体的交互作用，玩家对敌军士兵使用火焰喷射器时，流动的火焰在开放空间中会受到房屋建筑等物体的何种影响也需要予以真实体现。使用物理处理技术的
Klyotonn Entertainment游戏《赌命战士》(Bet on Soldier)截图。

注意火焰在拱门中的流动、沿墙面的扩散以及在楼梯上的翻腾。
以上还仅仅只是第一步。接下来还要在游戏的任何一部分都实现同样的物理处理，而不止是在我们今天所见到的某一个特定场景。再往后要做到的就是实现虚拟环境中的所有因素都能互相交互。比如在目前的FPS游戏中，如果玩家向敌手投掷手榴弹但没有正中目标，偏离的手榴弹爆炸后虽然也会伤到敌人，但仅此而已；而在有了物理处理后，附近的建筑物也会遭到破坏，敌人很可能因此被砸到。显然，这将在很大程度上改变未来的游戏模式，带来更多新的游戏策略。
BFG和华硕预计会在今年第二季度将各自的PhysX物理加速卡产品摆上货架，Alienware和Falcon Northwest等系统集成商也会随即推出相应的系统。具体的产品价格都没有公布，不过业界预计不同版本PhysX卡的价格会在100美元至400美元的范围内。

2、物理卡基本规格
1.1亿2500万晶体管

2.20W耗电

3.128MB GDDR3 RAM

4.130nm工艺

5.预计售价199至249美元

6.PCI接口

另外需要注意的是，鉴于物理卡采用PCI接口，因此需要额外电源连接器提供20W功率。未来的物理卡计划升级至PCIe 1x/4x接口。

AGEIA将把开发完成的物理卡交给其他厂商进行生产，nVIDIA届时负责销售。

二、DX10的革命性进化

1、nVIDIA正在加紧开发真正意义上的下一代GPU架构（代号可能是G80），而ATi也投入了R600系列的设计工作。这些产品都将支持 DirectX 10标准，起码是DX10的部分新功能。DX10将伴随Windows Vista在今年Q4投入市场， ATI和nVIDIA当然都希望届时能够准备好其全系列DX10显卡。我们甚至有可能在明年夏季就看到这样的产品：它们将能提供良好的DX9性能，同时又能支持未来Vista中的DX10标准。我们知道Vista将利用DX10来渲染桌面，因此3D显卡的作用不再仅仅体现在游戏中了。

根据我们的理解，DirectX 10不再采用“capabilities bit”的设计，也就是在驱动中定义一些“bit”来告诉系统这块显卡支持和不支持那些DirectX特效。理论上，对于DX10，只有完全支持或不支持两种极端情况。再也不会像DX9那样分为“Shader Model 2.0, 2.0b, 3.0”多种级别，抑或有的DX9显卡支持“geometry instance”，另一些则不。

另外，DX10还为我们带来了很多好处：统一的pixel和vertex shader界面，几何shader，小规模几何或材质的性能大提升，状态改变时性能损失的减少，以及减少驱动对CPU依赖程度的全新DLL结构。简单地说，只要有了硬件支持，DX10游戏的画面将让Xbox 360和PlayStation 3也自叹不如。

超越3D渲染

Windows Vista和DX10将是近年来电脑显示领域最重大的进步，但2006年我们还将看到这一领域的一些新趋势。ATi已经利用Avivo转码程序向我们演示了通用计算GPU（GPU for general purpose computing tasks，GP-GPU）的威力。ATi和nVIDIA都将在视频转码等多个领域内推广GP-GPU的应用。比如，物理引擎开发商Havok已经表示有意采用支持SM 3.0的显卡来进行物理模拟加速。说不定今后的显卡性能评测要加入一个新的项目：物理计算。

今年，微软的首要任务就是让Vista在市场上获得巨大成功，而要达到这一目标很重要的一点就是让玩家相信他们必须拥有Windows Vista和DX10显卡。总之，今年对于PC显示领域来说将是激动人心但又充满竞争的一年。各家厂商将努力集成并改进GPU的通用计算能力，并且竞相推出对DX10规格支持更完整，性能更好的新一代显卡。

2、DX10是超越家用机的契机

与Xbox 360和PS3相比，PC游戏性能超越家用机的契机将是Vista内建的DriectX 10，而前两者都是DirectX9。DirectX10将是一个完全不同的API，它需要完全不同的硬件。此前一些关于Windows Vista的图形API名称有很多说法，例如DirectX Next和Windows Graphics Foundation 2.0。但是Microsoft内部已经
称为DirectX 10，与某些报道说DX10将不会和Vista一起上市的说法，MS确认DX10将和Vista一同上市，同时还有DirectX 9.L，DX9的修正版，以满足Vista所使用的LDDM驱动模型。

DX10 修正了以前版本的稳定性和批性能问题，并去掉了一些不必要的功能。新的API对硬件也有更严格的要求，特别是必须要求某些功能集的存在。DX10中将不会有 "cap bits"来决定显卡是否可以执行某些特定功能。DX10的严格定义将保证开发人员获得期待的代码输出，并省去了为不同厂商不同图形卡优化的繁杂工作。

DX10 还对硬件提出了新的功能要求，首先是新的"几何Shader"功能，它将不同于当前的顶点Shader单元对单个顶点进行运算，而是对原始对象进行运算: 点，线，具有相邻顶点的线，三角形，具有具有相邻顶点的三角形等。独立性运算使得过去大量状态变化导致性能巨降的结果将不复存在。渲染状态可以群组分为5 个不同的对象，并储存在硬件Cache中，而每个类型Cache可以最多储存4096个不同状态的对象。DX10还在像素和顶点之间引入了一个普通的 shader内核。该功能的最大好处是游戏将呈现出前所未有的细节，渲染质量显然也将显著改善，包括AA质量。Cache还意味着更好的对象排序，由 GPU本身计算出内容，最终通过LDDM驱动模型的内存虚拟化来降低带宽耗费，从而更有效地读取数据。

当然，由于某些规格尚在变化，因此我们对Vista图形功能了解只能浅尝辄止。但是可以肯定地说:当DirectX 10游戏问世时，他们的质量将是下一代游戏主机游戏所无法达到的。
ATI CrossFire “交火"技术

2005年8月18日–全球绘图显示解决方案领导厂商 ATI公司 (TSX: ATY, NASDAQ:ATYT) 在北京正式发布一款终极游戏平台--CrossFire，精心设计的CrossFire平台将为游戏玩家带来最佳的效能、更高的弹性以及游戏兼容性，超越所有搭载多重绘图处理器的平台，彻底改变现今游戏环境。

CrossFire结合支持Intel与AMD处理器的ATI Radeon Xpress芯片组、一般Radeon等级绘图处理器以及一片Radeon CrossFire版本绘图卡，能为游戏玩家带来前所未有的优异效能与影像质量。

当游戏玩家加装一块ATI CrossFire版本绘图卡时，其Radeon Xpress系统中加入CrossFire组合引擎架构，让绘图着色处理效能增加一倍。搭配各种设定后，它们能发挥优异的运算画面输出威力，发挥出比单一绘图卡高出一倍的效能，或是选择利用运算威力来提供游戏的影像质量，呈现超越以往的真实场景。

ATI 个人计算机产品事业部资深副总裁Rick Bergman先生表示：“ATI的CrossFire平台提供无与伦比的游戏体验。它是当今业界具有最高兼容性与弹性的多重GPU平台，在提升效能与影像质量方面为使用者最多的选择。我们相信CrossFire卓越的游戏表现，将为这世代的绘图处理器以及新世代的绘图架构，创造全新的视觉典范。”

ATI CrossFire平台的优点之一就是拥有极高的游戏兼容性。ATI独特的多重绘图处理器模式让CrossFire能自动执行每款游戏，不论是新旧游戏都不必使用特别的游戏设定文件或升级趋动程序。使用者执行的游戏不论是刚发行或去年推出的，CrossFire都能自动为游戏调校出更快的速度以及更棒的画质。

游戏玩家可购买现成或轻松组装CrossFire系统。最高阶的CrossFire平台内含一块搭载ATI Radeon Xpress 200 CrossFire版本芯片组的主机板。这些主机板有两个专属的对等式PCI Express绘图扩充槽，能安装多片绘图卡，并针对高效能游戏进行最佳化设计。

包括像华硕、友通、精英、技嘉、微星、PC Partner、蓝宝以及撼讯等众多合作伙伴推出Radeon Xpress 200的CrossFiree-ready主机板，也都将游戏玩家的需求纳入考虑。他们同时支持AMD与Intel平台，并加入超频以及各种行家级的超值功能，其中包括高传真音效、双核心的支持能力、GigAbit以太网络、支持NCQ技术的SATA II接口、PCI Express接口的磁盘阵列、以及针对高效能系统内存提供最广泛的兼容性。

游戏玩家为CrossFire系统选择绘图卡时，可获得最多元的选择与弹性选购。Radeon X850 CrossFiree版本绘图卡内建256 MB绘图内存，可搭配任何Radeon X850等级绘图卡。而Radeon X800 CrossFire版本绘图卡内建有128 MB或256 MB的绘图内存，亦可搭配任何Radeon X800系列绘图卡产品。一般的Radeon X800与Radeon X850绘图卡可以透过新购买或是玩家现已拥有的相同等级绘图卡。

ATI及其产品伙伴将共同推出CrossFire版本的绘图卡，其中包括ABIT（升技）、ASUS(华硕)、Gigabyte（技嘉）、MSI（微星）、JETWAY（捷波）、Speedway（斯巴达克）、Yeston（盈通）、Seethur（七彩虹）、Maxan（铭瑄）、Unkia（双敏）、Soyo（梅捷）、Sapphire（蓝宝）、Dataland（迪兰恒进）、ECS（精英）、PCP、 J&W（杰微）、DFI（钻石）、EPOX（磐英）以及OEM厂商Thunis（紫光）、Founder（方正）、Tongfang（同方）。

包括ABS、Alienware、Cyberpower、Falcon Northwest、Hypersonic、Ibuypower、Monarch PC、PC Club、Polywell、Velocity Micro、VoodooPC以及ZT Group等系统厂商都将为游戏玩家推出搭载CrossFire系统的产品。

凭借着惊人的系统设计与绘图效能，CrossFire平台成为高阶游戏玩家心目中的梦幻武器。不论是重度游戏玩家或是一般玩家，都必定能获得身边朋友们投注以最高羡慕眼光。Radeon X800与Radeon X850绘图卡至今已创下近100万片的销售量，这些玩家们已经是ATI CrossFire的超级成员了。

xinwangchao

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
显卡达人修炼计划 [完成篇]

转载来自：http://bbs.zol.com.cn/index20070219/index_257_11247.htmlhttp://bbs.zol.com.cn/index20070219/index_257_11247.htmlAPI篇首先解释下API：是 Application Programming Interface应用程序接口的缩写，是许多程序的大集合。3D API能让编程人员所设计
复制链接

扫一扫