前言
逛了很多国外技术论坛,大家都建议采用 批处理+vbo绘制,不管静态数据还是动态数据。 最起码vbo吧,如果显卡支持上vao。
VA:vertex array
VBO:vertex buffer object
VAO:vertex array object
所谓动态数据就是 用于显示的数据每帧都在变化。静态数据即每帧保持不变,静态数据也可以使用顶点列表实现,但是最近几年随着gou发展,显示列表被vbo、vao技术代替。
VBO教程
VBO的 理论讲述和示例:http://www.songho.ca/opengl/gl_vbo.html
glBufferSubData 和glMapBuffer,使用subData函数客户端需要也保存一份数据,从而有选择的更新opengl服务器端VBO缓冲区。使用mapBuffer则客户单不需要保存数据拷贝,可以通过指针直接操作VBO缓冲区内容。
茶壶例子实测:
- 使用glBufferSubData 更新顶点和cpu计算直接采用顶点数组 两种方法 FPS均能飙到440左右。反而示例中给的glBufferMap 帧率只有350左右。显卡:ATI Radeon HD 4200
- 顶点数组fps:205,VBO的glMapBuffer帧率220,显卡:nvidia NVS4200M
显卡不同 结果为何相反?VBO性能疑问?
实际测试
但是实际测试 性能并不如意,在pc上VA和VBO性能接近,在手机上反而VBO要慢很多。
上图这个场景数据量大约400k。
Method1:定义一个20k的VBO,每当数据量达到20k,通过glBufferSubData函数将数据长传到VBO,然后调用glDrawElements函数绘制。
Method2:当数据量达到20k,使用glDrawElements 索引的方式绘制,不适用VBO。
Method3:使用glDrawArrays 绘制,顶点数据有冗余。
Method | FPS |
Vbo + glBufferSubData | 18-20 |
glDrawArrays | 27-29 |
glDrawElements | 27-29 |
VBO慢的原因在:glBufferSubData 上传数据 耗时大约:每4k 耗时30ms,绘制时调用glDrawElements 十分耗时,统计结果居然在秒级。。。
PC:ATI Radeon HD 4200
Mobile:HTC g10 gpu型号Adreno205,手机上采用opengles1.1标准。