cowboy笔记

最新推荐文章于 2024-06-28 18:37:40 发布

haomingzidoumeilea

最新推荐文章于 2024-06-28 18:37:40 发布

阅读量857

点赞数

分类专栏： opengl

本文链接：https://blog.csdn.net/haomingzidoumeilea/article/details/8747136

版权

opengl 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

http://www.programfan.com/CLUB/showtxt.asp?id=275228

对一些概念的讲解很详细，也许是自己没有好好看红书的原因吧。

单缓冲与双缓冲
opengl 支持一个称为双缓存的技术，可以有效的帮助我们解决这个问题。我们知道在我们电脑中，屏幕中显示的东西都会被放在一

个称为显示缓存的地方，在通常情况下我们只有一个这样的缓冲区，也就是单缓冲，在单缓冲中任何绘图的过程都会被显示在屏幕中

，这也就是我们为什么会看到闪烁，而所谓双缓冲就是再这个显示的缓冲区之外再建立一个不显示的缓冲区，我们所有的绘图都将

在这个不显示的缓冲区中进行，只有当一帧都绘制完了之后才会被拷贝到真正的现实缓冲区显示出来，这样中间过程对于最终用户就

是不可见的了，那即使是速度比较慢也只会出现停顿而不会有闪烁的现象出现。

索引颜色的主要优势是占用空间小（每个像素不必单独保存自己的颜色，只用很少的二进制位就可以代表其颜色在颜色表中的位置），花费系统资源少，图形运算速度快，但它编程稍稍显得不是那么方便，并且画面效果也会比RGB颜色差一些。“星际争霸”可能代表了256色的颜色表的画面效果，虽然它在一台很烂的PC上也可以运行很流畅，但以目前的眼光来看，其画面效果就显得不足了。

通常，用堆栈这种先保存后恢复的措施，比先变换再逆变换要更方便，更快速。

一旦每秒钟呈现的画面超过24幅，人们就会错以为它是连续的。
我们通常观看的电视，每秒播放25或30幅画面。但对于计算机来说，它可以播放更多的画面，以达到更平滑的效果。如果速度过慢，

画面不够平滑。如果速度过快，则人眼未必就能反应得过来。对于一个正常人来说，每秒60~120幅图画是比较合适的。具体的数值因

人而异。

让我们把计算机想象成一个画图比较快的人，假如他直接在屏幕上画图，而图形比较复杂，则有可能在他只画了某幅图的一半的时候

就被观众看到。而后面虽然他把画补全了，但观众的眼睛却又没有反应过来，还停留在原来那个残缺的画面上。也就是说，有时候观

众看到完整的图象，有时却又只看到残缺的图象，这样就造成了屏幕的闪烁。
如何解决这一问题呢？我们设想有两块画板，画图的人在旁边画，画好以后把他手里的画板与挂在屏幕上的画板相交换。这样以来，

观众就不会看到残缺的画了。这一技术被应用到计算机图形中，称为双缓冲技术。即：在存储器（很有可能是显存）中开辟两块区域

，一块作为发送到显示器的数据，一块作为绘画的区域，在适当的时候交换它们。由于交换两块内存区域实际上只需要交换两个指针

，这一方法效率非常高，所以被广泛的采用。
注意：虽然绝大多数平台都支持双缓冲技术，但这一技术并不是OpenGL标准中的内容。OpenGL为了保证更好的可移植性，允许在实现

时不使用双缓冲技术。当然，我们常用的PC都是支持双缓冲技术的。当然还有需要更改的地方——每次绘制完成时，我们需要交换两

个缓冲区，把绘制好的信息用于屏幕显示（否则无论怎么绘制，还是什么都看不到

3、关于垂直同步
某些朋友可能在运行时发现，虽然CPU几乎都用上了，但运动速度很快，根本看不清楚，另一些朋友在运行时发现CPU使用率很低，根

本就没有把空闲时间完全利用起来。但对于上面那段代码来说，这些现象都是合理的。这里就牵涉到关于垂直同步的问题。
大家知道显示器的刷新率是比较有限的，一般为60~120Hz，也就是一秒钟刷新60~120次。但如果叫计算机绘制一个简单的画面，例

如只有一个三角形，则一秒钟可以绘制成千上万次因此，如果最大限度的利用计算机的处理能力，绘制很多幅画面，但显示器的刷新

速度却跟不上，这不仅造成性能的浪费，还可能带来一些负面影响（例如，显示器只刷新到一半时，需要绘制的内容却变化了，由于

显示器是逐行刷新的，于是显示器上半部分和下半部分实际上是来自两幅画面）。采用垂直同步技术可以解决这一问题。即，只有在

显示器刷新时，才把绘制好的图象传输出去供显示。这样一来，计算机就不必去绘制大量的根本就用不到的图象了。如果显示器的刷

新率为85Hz，则计算机一秒钟只需要绘制85幅图象就足够，如果场景足够简单，就会造成比较多的CPU空闲。
几乎所有的显卡都支持“垂直同步”这一功能。
垂直同步也有它的问题。如果刷新频率为60Hz，则在绘制比较简单的场景时，绘制一幅图画需要的时间很段，帧速可以恒定在60FPS（

即60帧/秒）。如果场景变得复杂，绘制一幅图画的时间超过了1/60秒，则帧速将急剧下降。
如果绘制一幅图画的时间为1/50，则在第一个1/60秒时，显示器需要刷新了，但由于新的图画没有画好，所以只能显示原来的图画，

等到下一个1/60秒时才显示新的图画。于是显示一幅图画实际上用了1/30秒，帧速为30FPS。（如果不采用垂直同步，则帧速应该是

50FPS）
如果绘制一幅图画的时间更长，则下降的趋势就是阶梯状的：60FPS，30FPS，20FPS，……（60/1，60/2，60/3，……）
如果每一幅图画的复杂程度是不一致的，且绘制它们需要的时间都在1/60上下。则在1/60时间内画完时，帧速为60FPS，在1/60时间未

完成时，帧速为30FPS，这就造成了帧速的跳动。这是很麻烦的事情，需要避免它——要么想办法简化每一画面的绘制时间，要么都延

迟一小段时间，以作到统一。

回过头来看前面的问题。如果使用了大量的CPU而且速度很快无法看清，则打开垂直同步可以解决该问题。当然如果你认为垂直同步有

这样那样的缺点，也可以关闭它。

：只有在RGBA模式下，才可以使用混合功能，颜色索引模式下是无法使用混合功能的。

需要在绘制半透明物体时将深度缓冲区设置为只读，这样一来，虽然半透明物体被绘制上去了，深度缓冲区还保持在原来的状态。如

果再有一个物体出现在半透明物体之后，在不透明物体之前，则它也可以被绘制（因为此时深度缓冲区中记录的是那个不透明物体的

深度）

绘制顺序就是：首先绘制所有不透明的物体。如果两个物体都是不透明的，则谁先谁后都没有关系。然后，将深度缓冲区设置为只读

。接下来，绘制所有半透明的物体。如果两个物体都是半透明的，则谁先谁后只需要根据自己的意愿（注意了，先绘制的将成为“目

标颜色”，后绘制的将成为“源颜色”，所以绘制的顺序将会对结果造成一些影响）。最后，将深度缓冲区设置为可读可写形式。
调用glDepthMask(GL_FALSE);可将深度缓冲区设置为只读形式。调用glDepthMask(GL_TRUE);可将深度缓冲区设置为可读可写形式。

计算机保存图象的方法通常有两种：一是“矢量图”，一是“像素图”。矢量图保存了图象中每一几何物体的位置、形状、大小等信

息，在显示图象时，根据这些信息计算得到完整的图象。“像素图”是将完整的图象纵横分为若干的行、列，这些行列使得图象被分

割为很细小的分块，每一分块称为像素，保存每一像素的颜色也就保存了整个图象。
这两种方法各有优缺点。“矢量图”在图象进行放大、缩小时很方便，不会失真，但如果图象很复杂，那么就需要用非常多的几何体

，数据量和运算量都很庞大。“像素图”无论图象多么复杂，数据量和运算量都不会增加，但在进行放大、缩小等操作时，会产生失

真的情况。

OpenGL通常使用RGB来表示颜色，但BMP文件则采用BGR，就是说，顺序被反过来了。
另外需要注意的地方是：像素的数据量并不一定完全等于图象的高度乘以宽度乘以每一像素的字节数，而是可能略大于这个值。原因

是BMP文件采用了一种“对齐”的机制，每一行像素数据的长度若不是4的倍数，则填充一些数据使它是4的倍数。这样一来，一个

17*15的24位BMP大小就应该是834字节（每行17个像素，有51字节，补充为52字节，乘以15得到像素数据总长度780，再加上文件开始

的54字节，得到834字节）。分配内存时，一定要小心，不能直接使用“图象的高度乘以宽度乘以每一像素的字节数”来计算分配空间

的长度，否则有可能导致分配的内存空间长度不足，造成越界访问，带来各种严重后果。
一个很简单的计算数据长度的方法如下：

int LineLength, TotalLength;
LineLength = ImageWidth * BytesPerPixel; // 每行数据长度大致为图象宽度乘以
                                         // 每像素的字节数
while( LineLength % 4 != 0 )             // 修正LineLength使其为4的倍数
    ++LineLenth;
TotalLength = LineLength * ImageHeight; // 数据总长 = 每行长度 * 图象高度

这并不是效率最高的方法，但由于这个修正本身运算量并不大，使用频率也不高，我们就不需要再考虑更快的方法了。

3、glReadPixels的用法和举例
3.1 函数的参数说明
该函数总共有七个参数。前四个参数可以得到一个矩形，该矩形所包括的像素都会被读取出来。（第一、二个参数表示了矩形的左下

角横、纵坐标，坐标以窗口最左下角为零，最右上角为最大值；第三、四个参数表示了矩形的宽度和高度）
第五个参数表示读取的内容，例如：GL_RGB就会依次读取像素的红、绿、蓝三种数据，GL_RGBA则会依次读取像素的红、绿、蓝、

alpha四种数据，GL_RED则只读取像素的红色数据（类似的还有GL_GREEN，GL_BLUE，以及GL_ALPHA）。如果采用的不是RGBA颜色模式

，而是采用颜色索引模式，则也可以使用GL_COLOR_INDEX来读取像素的颜色索引。目前仅需要知道这些，但实际上还可以读取其它内

容，例如深度缓冲区的深度数据等。
第六个参数表示读取的内容保存到内存时所使用的格式，例如：GL_UNSIGNED_BYTE会把各种数据保存为GLubyte，GL_FLOAT会把各种数

据保存为GLfloat等。
第七个参数表示一个指针，像素数据被读取后，将被保存到这个指针所表示的地址。注意，需要保证该地址有足够的可以使用的空间

，以容纳读取的像素数据。例如一幅大小为256*256的图象，如果读取其RGB数据，且每一数据被保存为GLubyte，总大小就是：

256*256*3 = 196608字节，即192千字节。如果是读取RGBA数据，则总大小就是256*256*4 = 262144字节，即256千字节。

注意：glReadPixels实际上是从缓冲区中读取数据，如果使用了双缓冲区，则默认是从正在显示的缓冲（即前缓冲）中读取，而绘制

工作是默认绘制到后缓冲区的。因此，如果需要读取已经绘制好的像素，往往需要先交换前后缓冲。

从效果上看，glCopyPixels进行像素复制的操作，等价于把像素读取到内存，再从内存绘制到另一个区域，因此可以通过

glReadPixels和glDrawPixels组合来实现复制像素的功能。然而我们知道，像素数据通常数据量很大，例如一幅1024*768的图象，如

果使用24位BGR方式表示，则需要至少1024*768*3字节，即2.25兆字节。这么多的数据要进行一次读操作和一次写操作，并且因为在

glReadPixels和glDrawPixels中设置的数据格式不同，很可能涉及到数据格式的转换。这对CPU无疑是一个不小的负担。使用

glCopyPixels直接从像素数据复制出新的像素数据，避免了多余的数据的格式转换，并且也可能减少一些数据复制操作（因为数据可

能直接由显卡负责复制，不需要经过主内存），因此效率比较高。

一个坐标表示顶点在三维空间的位置时，可以使用glRotate*等函数来对坐标进行转换。纹理坐标也可以进行这种转换。只要使用

glMatrixMode(GL_TEXTURE);，就可以切换到纹理矩阵（另外还有透视矩阵GL_PROJECTION和模型视图矩阵GL_MODELVIEW，详细情况在

第五课有讲述），然后glRotate*，glScale*，glTranslate*等操作矩阵的函数就可以用来处理“对纹理坐标进行转换”的工作了

纹理映射是一个相当复杂的过程，OpenGL最基本的执行纹理映射所需的步骤主要是：1）定义纹理glTexImage2D()；2）控制滤波

glTexParameterf()；3）说明映射方式glTexEnvf()；4）绘制场景，给出顶点的纹理坐标和几何坐标glEnable(GL_TEXTURE_2D)和

glTexCoord2f()。纹理映射只能在RGBA方式下执行，不能运用于颜色表方式。

前面已经提到过，载入一幅纹理所需要的时间是比较多的。因此应该尽量减少载入纹理的次数。如果只有一幅纹理，则应该在第一次

绘制前就载入它，以后就不需要再次载入了。这点与glDrawPixels函数很不相同。每次使用glDrawPixels函数，都需要把像素数据重

新载入一次，因此用glDrawPixels函数来反复绘制图象的效率是较低的（如果只绘制一次，则不会有此问题），使用纹理来反复绘制

图象是可取的做法
通过创建多个纹理对象来达到同时保存多幅纹理的目的。这样一来，在第一次使用纹理前，把所有的纹理都载入，然后在绘制时只需

要指明究竟使用哪一个纹理对象就可以了。
GLuint texture_ID;
glGenTextures(1, &texture_ID); // 分配一个纹理对象的编号
或者：

GLuint texture_ID_list[5];
glGenTextures(5, texture_ID_list); // 分配5个纹理对象的编号

零是一个特殊的纹理对象编号，表示“默认的纹理对象”，在分配正确的情况下，glGenTextures不会分配这个编号。与

glGenTextures对应的是glDeleteTextures，用于销毁一个纹理对象。

还有一种方法可以保证像素只绘制到某一个特定的矩形区域内，这就是视口变换（在第五课第3节中有介绍）。但视口变换和剪裁测试

是不同的。视口变换是将所有内容缩放到合适的大小后，放到一个矩形的区域内；而剪裁测试不会进行缩放，超出矩形范围的像素直

接忽略掉。

http://bbs.pfan.cn/post-252901.html 测试

Alpha测试只要简单的比较大小就可以得到最终结果，而混合操作一般需要进行乘法运算，性能有所下降。
。如果某项测试不通过，则不会进行下一步，而只有所有测试都通过的情况下才会执行混合操作。因此，在使用Alpha测试的情况下，

透明的像素就不需要经过模板测试和深度测试了；而如果使用混合操作，即使透明的像素也需要进行模板测试和深度测试，性能会有

所下降。还有一点：对于那些“透明”的像素来说，如果使用Alpha测试，则“透明”的像素不会通过测试，因此像素的深度值不会被

修改；而使用混合操作时，虽然像素的颜色没有被修改，但它的深度值则有可能被修改掉了。
因此，如果所有的像素都是“透明”或“不透明”，没有“半透明”时，应该尽量采用Alpha测试而不是采用混合操作。当需要绘制半

透明像素时，才采用混合操作。

每个像素的“模板值”会根据模板测试的结果和深度测试的结果而进行改变。

glStencilOp(fail, zfail, zpass);
该函数指定了三种情况下“模板值”该如何变化。第一个参数表示模板测试未通过时该如何变化；第二个参数表示模板测试通过，但

深度测试未通过时该如何变化；第三个参数表示模板测试和深度测试均通过时该如何变化。如果没有起用模板测试，则认为模板测试

总是通过；如果没有启用深度测试，则认为深度测试总是通过）
\

模板缓冲区与深度缓冲区有一点不同。无论是否启用深度测试，当有像素被绘制时，总会重新设置该像素的深度值（除非设置

glDepthMask(GL_FALSE);）。而模板测试如果不启用，则像素的模板值会保持不变，只有启用模板测试时才有可能修改像素的模板值

别把glDisable（GL_DEPETH_TEST）和glDepthMask(GL_FALSE)弄混了！！

两者的区别在于：模板测试是设定一个值，在测试时用这个设定值与像素的“模板值”进行比较，而深度测试是根据顶点的空间坐标

计算出深度，用这个深度与像素的“深度值”进行比较。也就是说，模板测试需要指定一个值作为比较参考，而深度测试中，这个比

较用的参考值是OpenGL根据空间坐标自动计算的。

gl是核心，glu是对gl的部分封装，glut是OpenGL的跨平台工具库，gl中包含了最基本的3D函数，而glu似乎对gl的辅助，如果算数好

，不用glu的情况下，也是可以做出同样的效果。

glut是基本的窗口界面，是独立于gl和glu的，如果不喜欢用glut可以用MFC和Win32窗口等代替，但是glut是跨平台的，这就保证了我

们编出的程序是跨平台的，如果用MFC或者Win32只能在windows操作系统上使用。选择OpenGL的一个很大原因就是因为它的跨平台性，

所以我们可以尽量的使用glut库。

提供了“顶点数组”的功能，可以把很多顶点数据放到数组中，然后通过调用很少的函数就完成绘制，而不必像OpenGL 1.0那样使用

glBegin, glEnd以及大量的glColor*, glNormal*, glTexCoord*, glVertex*等函数。这些功能都是通过指针完成的。因此在绑定了顶

点缓冲后，也可以用缓冲中的数据和指定偏移值的方式来代替原来的数组。数组是保存在内存中的，而缓冲数据则有可能是直接保存

在显卡上，因此有望得到性能的优化。

OpenGL是一个状态机，它保持自身的状态，除非用户输入一条命令让它改变状态。
颜色、纹理坐标、源因子和目标因子、光源的各种参数，等等，这些都是状态，所以这一句话就包含了上面叙述的所有内容。
此外，“是否启用了光照”、“是否启用了纹理”、“是否启用了混合”、“是否启用了深度测试”等等，这些也都是状态，也符合

上面的描述：OpenGL会保持状态，除非我们调用OpenGL函数来改变它。

Per-vertex operations and primitive assembly: 单一的顶点操作以及图元装配。首先对单一的顶点进行操作，比如变换（参见第

五课）。然后把顶点装配为图元（图元就是OpenGL所能绘制的最简单的图形，比如点、线段、三角形、四边形、多边形等，
Rasterization: 光栅化。顶点数据和像素数据在这里交汇（可以想像成：顶点和纹理，一起组合成了具有纹理的三角形），形成完整

的、可以显示的一整块（可能是点、线段、三角形、四边形，或者其它不规则图形），里面包含若干个像素。这一整块被称为

fragment（片段）。

再来说说顶点数组与显示列表的区别。两者都可以明显的减少函数的调用次数，但是还是各有优点的。
对于顶点数组，顶点数据是存放在内存中的，也就是存放在客户端。每次绘制的时候，需要把所有的顶点数据从客户端（内存）发送

到服务端（显示设备），然后进行处理。对于显示列表，顶点数据是放在显示列表中的，显示列表本身又是存放在服务器端的，所以

不会重复的发送数据。
对于顶点数组，因为顶点数据放在内存中，所以可以随时修改，每次绘制的时候都会把当前数组中的内容作为顶点数据发送并进行绘

制。对于显示列表，数据已经存放到服务器段，并且无法取出，所以无法修改。
也就是说，显示列表可以避免数据的重复发送，效率会较高；顶点数组虽然会重复的发送数据，但由于数据可以随时修改，灵活性较

好。

前面说到顶点数组和显示列表在绘制立方体时各有优劣，那么有没有办法将它们的优点集中到一起，并且尽可能的减少缺点呢？顶点

缓冲区对象就是为了解决这个问题而诞生的。它数据存放在服务端，同时也允许客户端灵活的修改，兼顾了运行效率和灵活性。

顶点缓冲区对象跟纹理对象有很多相似之处。首先，分配一个缓冲区对象编号，然后，为对应编号的缓冲区对象指定数据，以后可以

随时修改其中的数据。下面的表格可以帮助类比理解。

                                  纹理对象         顶点缓冲区对象
分配编号                          glGenTextures    glGenBuffersARB
绑定（指定为当前所使用的对象）    glBindTexture    glBindBufferARB
指定数据                          glTexImage*      glBufferDataARB
修改数据                          glTexSubImage*   glBufferSubDataARB

当使用glBindBufferARB后，各种使用指针为参数的OpenGL函数，行为会发生变化。
以glColor3fv为例，通常，这个函数接受一个指针作为参数，从指针所指的位置取出连续的三个浮点数，作为当前的颜色。
但使用glBindBufferARB后，这个函数不再从指针所指的位置取数据。函数会先把指针转化为整数，假设转化后结果为k，则会从当前

缓冲区的第k个字节开始取数据。特别一点，如果我们写glColor3fv(NULL);因为NULL转化为整数后通常是零，所以从缓冲区的第0个字

节开始取数据，也就是从缓冲区最开始的位置取数据。
这样一来，原来写的

glVertexPointer(3, GL_FLOAT, 0, vertex_list);
glDrawElements(GL_QUADS, 24, GL_UNSIGNED_INT, index_list);
在使用缓冲区对象后，就变成了

glVertexPointer(3, GL_FLOAT, 0, NULL);
glDrawElements(GL_QUADS, 24, GL_UNSIGNED_INT, NULL);

haomingzidoumeilea

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
cowboy笔记

http://www.programfan.com/CLUB/showtxt.asp?id=275228对一些概念的讲解很详细，也许是自己没有好好看红书的原因吧。单缓冲与双缓冲opengl 支持一个称为双缓存的技术，可以有效的帮助我们解决这个问题。我们知道在我们电脑中，屏幕中显示的东西都会被放在一个称为显示缓存的地方，在通常情况下我们只有一个这样的缓冲区，也就是
复制链接

扫一扫

专栏目录