OpenGL基础教程:实现选取、平移、旋转操作

本文还有配套的精品资源,点击获取 menu-r.4af5f7ec.gif

简介:OpenGL是一种跨平台编程接口,用于生成二维和三维图像。本教程通过“OpenGL教学程序-选取、平移、旋转”指导初学者掌握OpenGL的基本操作,包括如何在3D空间中选取对象、平移和旋转物体。程序解析了MFC与OpenGL的集成,帮助初学者理解如何将图形用户界面和OpenGL结合,并处理用户输入事件,为进一步的3D图形编程打下基础。
OpenGL

1. OpenGL概述与基础操作

1.1 OpenGL简介

OpenGL(Open Graphics Library)是一个跨语言、跨平台的编程接口,用于渲染2D和3D矢量图形。它被广泛应用于计算机图形领域,尤其是在视频游戏和CAD/CAM软件中。OpenGL由Khronos Group管理,是一个开放的标准,允许开发者利用各种GPU硬件加速图形渲染。

1.2 安装与配置OpenGL环境

要在计算机上开始使用OpenGL,首先需要安装一个支持OpenGL的图形驱动。然后,选择合适的开发环境和库文件。对于Windows系统,常见的选择包括:

  • 使用Visual Studio安装OpenGL的SDK和库文件。
  • 使用GLUT(OpenGL Utility Toolkit)简化OpenGL程序的开发。
  • 配置GLFW(OpenGL Utility Library)来创建窗口和处理用户输入。

安装完成后,开发者将能够开始编写OpenGL代码并渲染基本的几何图形。

1.3 OpenGL基础操作流程

为了在OpenGL中绘制图形,需要遵循以下基础步骤:

  • 初始化OpenGL上下文。
  • 定义几何形状(顶点、线段、三角形等)。
  • 设置视图和投影矩阵,确定图形的显示区域和深度。
  • 在渲染循环中,通过着色器程序传递顶点和颜色数据。
  • 执行绘制命令,将图形数据发送到图形管线进行渲染。
  • 清理资源并关闭OpenGL上下文。

通过这些步骤,可以完成OpenGL的基础操作,并为进一步学习OpenGL的高级功能奠定基础。

2. 物体选取机制及实现

2.1 选取机制的概念与重要性

2.1.1 选取机制在3D场景中的作用

在3D图形编程中,选取机制(Picking)是一种用于识别用户感兴趣对象的技术。在复杂的场景中,用户往往需要对特定的物体进行交互,比如选择物体、编辑属性等操作。选取机制使得软件能够确定用户所点击的区域对应场景中的哪一个3D对象,从而可以实现对该对象的操作。这不仅提高了用户体验,还增强了程序的交互性。

2.1.2 如何通过OpenGL实现选取机制

OpenGL本身并不提供直接的选取机制,开发者需要自己实现这一功能。选取机制通常包含以下步骤:
1. 在视图中模拟一次“绘制”过程(称为“选取渲染”),在这个过程中,不是用实际的颜色绘制物体,而是将物体的唯一ID作为颜色输出到一个帧缓冲区(选取缓冲区)。
2. 使用鼠标点击事件获取屏幕坐标。
3. 将屏幕坐标映射到裁剪坐标系中,从而确定在选取缓冲区中对应的像素点。
4. 读取该像素点的值,即为被选中物体的ID。

2.2 选取操作的实践技巧

2.2.1 选取缓冲区的设置和使用

选取缓冲区的设置是选取操作中的关键步骤之一。选取缓冲区是一个特殊的帧缓冲区,用于在选取过程中存储物体ID。

代码示例:

GLuint selectBuffer[BUFSIZE];
glSelectBuffer(BUFSIZE, selectBuffer); // 创建并初始化选择缓冲区
glInitNames(); // 初始化名称栈
glPushName(0); // 将0压入名称栈,作为基准

逻辑分析:
- glSelectBuffer 创建一个选择缓冲区并分配内存。 BUFSIZE 是缓冲区大小,通常设置为足够大以存储一个场景中所有物体名称。
- glInitNames 初始化名称栈,这是后续使用名称绘制物体的前提。
- glPushName(0) 将0压入名称栈,这里0是根名称。在实际应用中,根名称代表整个场景或者视口。

2.2.2 事件处理与选取事件的响应

选取操作需要捕捉用户的输入事件,尤其是鼠标点击事件。在鼠标点击后,需要计算被点击位置对应的物体。

代码示例:

void onMouseClick(int button, int state, int x, int y) {
    if (button == MOUSE_LEFT && state == MOUSE_DOWN) {
        glSelectBuffer(BUFSIZE, selectBuffer);
        glInitNames();
        glPushName(0);

        glRenderMode(GL_SELECT);
        glMatrixMode(GL_PROJECTION);
        glLoadIdentity();
        gluPickMatrix((GLdouble)x, (GLdouble)y, 5.0, 5.0, viewport);

        drawScene(); // 绘制场景
        glFlush();
        hits = glRenderMode(GL_RENDER);
        processHits(selectBuffer);
    }
}

逻辑分析:
- onMouseClick 函数用于处理鼠标点击事件。在用户按下鼠标左键时触发。
- glSelectBuffer glInitNames 与之前的设置相同。
- glRenderMode(GL_SELECT) 切换OpenGL渲染模式为选择模式。
- glMatrixMode(GL_PROJECTION) glLoadIdentity 设置投影矩阵为当前矩阵,并重置矩阵为单位矩阵。
- gluPickMatrix 将选取矩阵设置为当前矩阵,使得选取操作只对鼠标点击的区域敏感。
- drawScene 函数用于绘制场景。
- glRenderMode(GL_RENDER) 退出选择模式并返回被选择的物体数量。
- processHits 函数用于处理选取结果。

2.2.3 选取与变换的结合应用

选取机制可以与图形变换结合使用,以实现复杂的交互。例如,选取物体后,用户可能需要对其进行移动、旋转或缩放等操作。

代码示例:

void processHits(GLuint *buffer) {
    for (int i = 0; i < hits; ++i) {
        glLoadName(buffer[3 * i]);
        // 此处可以根据名称加载物体变换矩阵或执行其它操作
    }
}

逻辑分析:
- processHits 函数用于处理选择缓冲区中的内容。
- 循环遍历缓冲区中的每个元素, buffer[3 * i] 是选取名称。
- 在这个过程中,可以根据名称选择特定物体,并对其进行变换操作。

选取机制是交互式3D图形应用中不可或缺的一部分,通过上述示例和逻辑分析,我们可以看到实现选取机制的步骤和相关代码细节。在实际应用中,选取机制可以与其它技术相结合,例如与变换操作结合,提供更加丰富的用户交互体验。

3. 平移操作原理及实现

3.1 平移变换的数学基础

3.1.1 理解三维空间中的平移向量

在三维空间中进行图形变换时,平移是最基本的操作之一。平移向量定义了图形在三维空间中的移动方向和距离。在数学上,三维空间中的一个点P的坐标可以表示为 (x, y, z),而平移向量T可以表示为 (Tx, Ty, Tz)。进行平移变换时,点P的坐标将变为:

P’ = (x + Tx, y + Ty, z + Tz)

这个过程可以通过矩阵乘法来实现,其中平移矩阵通常用以下形式表示:

1   0   0   Tx
0   1   0   Ty
0   0   1   Tz
0   0   0   1

这种表示方法可以将平移变换与其他变换(如旋转和缩放)结合在一起。

3.1.2 平移变换的矩阵表示

平移变换可以通过齐次坐标系来表达,这是一种在三维空间中表示点的方法,即在点的坐标后追加一个额外的坐标,通常设为1。这样,平移矩阵可以更简便地用以下齐次形式表示:

1   0   0   Tx
0   1   0   Ty
0   0   1   Tz
0   0   0   1

对于任意点P(x, y, z, 1),通过矩阵乘法得到新的点P’(x’, y’, z’, 1):

[x']   [1   0   0   Tx]   [x]
[y'] = [0   1   0   Ty] * [y]
[z']   [0   0   1   Tz]   [z]
[1 ]   [0   0   0   1 ]   [1]

这样,通过简单的矩阵乘法,就能实现点的平移操作。

3.2 平移操作的代码实现

3.2.1 OpenGL中平移函数的应用

OpenGL提供了一系列的函数来执行基本的图形变换。对于平移操作,OpenGL中可以使用 glTranslatef 函数来实现。例如,以下代码片段展示了如何将图形在X轴方向平移1.0个单位:

glPushMatrix(); // 保存当前的矩阵状态
glTranslatef(1.0f, 0.0f, 0.0f); // 在X轴方向平移1.0单位
// 这里进行绘图操作...
glPopMatrix(); // 恢复之前的矩阵状态

3.2.2 结合用户输入进行动态平移

为了实现用户交互式的图形平移,可以结合键盘输入事件来动态调用 glTranslatef 函数。例如,以下代码展示了如何响应键盘事件来左右移动图形:

void handleKeypress(unsigned char key, int x, int y) {
    switch(key) {
        case 'a': // 向左平移
            glTranslatef(-0.1f, 0.0f, 0.0f);
            break;
        case 'd': // 向右平移
            glTranslatef(0.1f, 0.0f, 0.0f);
            break;
        // 其他按键处理...
    }
    glutPostRedisplay(); // 重绘视图
}

3.2.3 平移操作与其他变换的组合

平移操作往往和其他变换(例如旋转和缩放)一起使用。OpenGL使用矩阵栈的方式来管理变换的组合。以下代码展示了如何在进行一系列变换后,返回到变换前的状态:

glPushMatrix(); // 开始记录新的变换状态

// 进行一系列变换
glRotatef(angle, 0, 1, 0); // 旋转
glScalef(0.5f, 0.5f, 0.5f); // 缩放
glTranslatef(1.0f, 0.0f, 0.0f); // 平移

// 执行绘制操作...

glPopMatrix(); // 恢复之前保存的变换状态

在这个例子中,所有变换都被组合在一起,然后通过 glPopMatrix() 来恢复到变换前的状态。这种操作确保了变换的顺序性和可逆性。

4. 旋转操作原理及实现

4.1 旋转变换的理论基础

4.1.1 三维空间中的旋转轴和角度

在三维空间中,旋转可以围绕一条通过原点的轴线进行。这条轴线被称为旋转轴,旋转的角度是围绕该轴线旋转的量度,用度数或者弧度表示。理解旋转轴和角度是学习旋转变换的关键。通过旋转轴和角度,我们可以确定旋转的性质和方向。

想象一下,当你在三维空间中旋转一个物体时,你首先需要确定一个旋转轴。这个轴线是固定的,并且是三维空间中的一条直线。然后,你指定一个旋转角度,这个角度告诉物体需要绕着这个轴旋转多少。在计算机图形学中,旋转变换通常使用旋转矩阵来表达。

旋转矩阵是一种特殊类型的矩阵,它能够以线性变换的形式表示旋转操作。旋转矩阵有几种不同的形式,例如,绕Z轴、X轴和Y轴的旋转矩阵。这些基本旋转矩阵可以被组合起来创建任意轴的旋转矩阵。这些矩阵遵循右手定则,即当你的右手的四指指向旋转轴的正方向时,伸直的大拇指的方向表示旋转的方向。

4.1.2 旋转矩阵的构建和性质

旋转矩阵是一个方阵,它的列向量和行向量都是单位向量,并且相互垂直。在三维空间中,一个完整的旋转矩阵是3x3的。其性质包括:

  • 旋转矩阵是正交矩阵,即矩阵的转置等于它的逆矩阵。
  • 矩阵的行列式值为+1,表示保持体积不变。
  • 旋转矩阵的左上角3x3子矩阵就是描述旋转的矩阵。

构建旋转矩阵的方法依赖于旋转轴和旋转角度。例如,假设我们有一个绕Z轴旋转θ角度的旋转矩阵Rz,那么它可以用下面的公式来构建:

Rz = | cosθ -sinθ  0 |
     | sinθ  cosθ  0 |
     |  0     0    1 |

其中, cosθ -sinθ 分别表示旋转角度的余弦和正弦值。通过这个矩阵,任何点P在三维空间中绕Z轴旋转θ角度后的新位置可以使用矩阵乘法 P_new = Rz * P 来计算。

旋转矩阵的构建不仅是理论知识的一部分,而且是实现旋转操作的重要基础。构建旋转矩阵后,可以使用它来对图形学中的模型或者场景中的任意物体进行旋转操作。

4.2 旋转操作的编程实践

4.2.1 OpenGL中的旋转函数应用

OpenGL提供了一系列的函数来处理图形的旋转操作。其中比较常用的是 glRotatef() 函数。这个函数允许我们指定旋转角度以及旋转轴的三个分量(x, y, z),从而生成一个旋转矩阵并对当前的矩阵模式进行相应的操作。

函数 glRotatef() 的原型如下:

void glRotatef(GLfloat angle,GLfloat x, GLfloat y, GLfloat z);

其中, angle 参数表示旋转的角度,单位是度; x y z 表示旋转轴的方向向量。调用这个函数后,会根据指定的轴和角度计算出一个旋转矩阵,并将当前矩阵与这个旋转矩阵相乘。

例如,如果我们想围绕X轴旋转45度,可以这样调用:

glRotatef(45.0f, 1.0f, 0.0f, 0.0f);

每次调用 glRotatef() 都会叠加旋转效果。因此,如果你需要多次旋转,需要在每次旋转前保存当前的矩阵状态,执行旋转后,恢复矩阵状态继续新的旋转操作。

4.2.2 交互式旋转操作的实现

要实现交互式旋转操作,我们需要捕捉用户的输入,并将这些输入转化为旋转操作。通常,这涉及鼠标或者触摸板的拖动事件,通过这些事件我们可以感知用户的旋转意图,并计算旋转轴和角度。

举一个例子,假设我们需要实现一个场景,用户可以通过鼠标左右拖动来旋转场景。我们首先需要记录鼠标拖动的起始位置和结束位置,然后计算两者的差值,这个差值就能表示用户想要旋转的方向和角度。通常我们会使用一种叫做“弧度”的单位来计算角度,以便与OpenGL中的函数配合。

以下是一个简化的代码示例,展示如何在OpenGL中实现基于鼠标拖动的交互式旋转:

// 伪代码,展示基本思路
float lastX = 0.0f;
float lastY = 0.0f;

void mouseDragged(float deltaX, float deltaY) {
    float radianX = deltaX * 0.01; // 假设每个像素对应旋转0.01弧度
    float radianY = deltaY * 0.01;
    glRotatef(radianX, 0.0f, 1.0f, 0.0f); // 绕Y轴旋转
    glRotatef(radianY, 1.0f, 0.0f, 0.0f); // 绕X轴旋转
}

在实际应用中,我们可能还需要考虑旋转轴的计算,以及如何将旋转应用到具体的3D模型上,这可能需要进行坐标变换和矩阵叠加等操作。

4.2.3 旋转操作与其他变换的综合运用

在实际的3D渲染中,旋转操作很少单独使用,它通常和其他变换(如平移、缩放)一起使用,来达到复杂的变换效果。组合变换允许我们对3D对象执行更自由和更复杂的变形。

例如,一个常见的操作是先平移一个物体,然后对其进行旋转,最后进行缩放。为了实现这样的操作,我们可以使用OpenGL的矩阵堆栈(Matrix Stack),这样可以避免每次变换后需要重置变换矩阵的麻烦。

在OpenGL中,我们通常使用 glMatrixMode() 函数来指定我们正在操作的矩阵类型,然后使用 glPushMatrix() glPopMatrix() 来保存和恢复矩阵状态。这样,我们就可以执行一系列的变换操作,而不会互相影响。

glMatrixMode(GL_MODELVIEW);  // 指定当前矩阵为模型视图矩阵
glLoadIdentity();            // 重置当前矩阵为单位矩阵

// 假设先进行平移变换
glTranslatef(x, y, z);

// 执行旋转操作
glRotatef(angle, x_axis, y_axis, z_axis);

// 最后进行缩放变换
glScalef(sx, sy, sz);

// 绘制物体
drawObject();

在上述代码中, glMatrixMode(GL_MODELVIEW) 告诉OpenGL我们正在对模型视图矩阵进行操作。 glLoadIdentity() 将当前矩阵重置为单位矩阵。然后,我们分别使用 glTranslatef() , glRotatef() , 和 glScalef() 来执行平移、旋转和缩放操作。每一步变换都会影响接下来的对象绘制,最终对象会展示出组合变换后的效果。

4.3 旋转操作的优化与思考

4.3.1 优化旋转性能

在处理3D图形时,频繁的旋转操作可能会导致性能下降。这是因为每次旋转操作都会涉及复杂的矩阵运算和图形变换。为了提高性能,可以考虑以下优化方法:

  • 减少不必要的旋转操作 :如果场景中没有实际的变化,就不需要重新计算和绘制旋转后的图形。
  • 使用矩阵堆栈来管理变换 :如前所述,使用矩阵堆栈可以有效地管理不同的变换状态,避免重复计算。
  • 硬件加速 :许多现代图形处理单元(GPU)提供了硬件加速旋转功能,使用这些功能可以显著提高性能。

4.3.2 旋转操作的限制和解决方案

尽管旋转可以应用于3D图形的许多方面,但它也有一些限制:

  • 累积误差 :当进行多次连续旋转时,由于浮点数运算的精度限制,可能会产生累积误差。一种解决方法是使用四元数来进行旋转操作,它可以在没有累积误差的情况下表示旋转。
  • 旋转轴的限制 :有时,用户可能需要围绕一个非标准轴(如一个物体的局部轴)旋转,OpenGL内置的旋转函数不能直接支持。这时可以使用四元数或者矩阵分解的方法来实现这种自定义轴的旋转。

4.3.3 旋转操作的未来展望

随着虚拟现实(VR)和增强现实(AR)技术的发展,3D旋转操作在用户交互中的重要性变得日益显著。为了提供更加自然和直观的交互体验,未来的旋转操作可能会更加依赖于机器学习和人工智能技术。通过分析用户的交互习惯和场景的物理特性,算法能够更加精确地预测用户意图,并优化旋转操作以适应不同的应用场景。

在可预见的未来,旋转操作可能会变得更加智能化和自动化,使得开发者能够在创建3D应用程序时,减少手动调整旋转参数的工作量,同时提供更加流畅和直观的用户体验。

5. OpenGL与MFC集成方法及用户输入事件处理

5.1 OpenGL与MFC集成的策略

5.1.1 MFC框架下OpenGL上下文的创建

在使用Microsoft Foundation Classes (MFC) 创建基于对话框的应用程序时,集成OpenGL环境是相对直接的过程。首先,需要在对话框类中添加一个用于OpenGL绘制的视图类。这通常涉及到在对话框类的头文件中声明一个COpenGLControl或类似自定义控件的实例。

// 在Dialog.h中
class COpenGLControl m_OpenGLControl; // 声明OpenGL控件

// 在Dialog.cpp中
BOOL CYourDialog::OnInitDialog()
{
    CDialogEx::OnInitDialog();

    // 初始化OpenGL控件
    m_OpenGLControl.Create(WS_CHILD | WS_VISIBLE, CRect(0, 0, 640, 480), this, 101);
    m_OpenGLControl.SetOpenGLContext(&m_glContext); // 设置OpenGL上下文

    // 初始化OpenGL渲染器等其他相关设置
    ...
}

5.1.2 设备上下文与渲染上下文的关联

渲染上下文(RC)负责管理OpenGL的渲染状态和当前绘制的表面。在MFC中,设备上下文(DC)是用于显示输出的GDI对象。OpenGL上下文需要与设备上下文进行关联,这样OpenGL才能在MFC应用程序中进行渲染。通常,这可以通过初始化OpenGL上下文(RC)并将其与设备上下文(DC)关联来实现。

// 创建渲染上下文
m_glContext.Create(m_hWnd, NULL);

// 获取设备上下文
CDC* pDC = m_OpenGLControl.GetDC();

// 将设备上下文与渲染上下文关联
m_glContext.MakeCurrent(pDC);

// 在渲染循环中使用OpenGL命令进行绘制
// ...

// 完成绘制后,释放DC
m_OpenGLControl.ReleaseDC(pDC);

// 释放渲染上下文
m_glContext.DeleteCurrent();

5.2 用户输入事件的处理

5.2.1 键盘事件的捕获与响应

在MFC应用程序中,可以通过对话框类重写OnKeyDown或OnKeyUp事件处理函数来捕获键盘输入。这些函数提供了键盘事件的详细信息,例如虚拟键码(vkey)和按键状态。

// 在Dialog.cpp中重写OnKeyDown函数
void CYourDialog::OnKeyDown(UINT nChar, UINT nRepCnt, UINT nFlags)
{
    // 处理键盘事件
    switch(nChar)
    {
        case VK_LEFT: // 左箭头键被按下
            // 执行特定操作,例如旋转视图
            break;
        // 其他按键处理...
    }
    CDialogEx::OnKeyDown(nChar, nRepCnt, nFlags);
}

5.2.2 鼠标事件在OpenGL中的应用

鼠标事件的处理通常涉及到检测鼠标移动或点击来改变视图或交互式操作。在MFC中,可以通过重写鼠标事件处理函数如OnLButtonDown、OnLButtonUp、OnMouseMove等来响应鼠标事件。

// 在Dialog.cpp中重写OnMouseMove函数
void CYourDialog::OnMouseMove(UINT nFlags, CPoint point)
{
    // 获取鼠标移动位置信息
    // ...

    // 根据鼠标位置更新视图参数或执行相应操作
    // ...
}

// 其他鼠标事件处理函数...

5.2.3 鼠标与键盘组合实现高级交互

在进行三维场景操作时,结合使用键盘和鼠标可以实现更复杂的用户交互。例如,使用鼠标中键配合键盘的WASD键可实现三维空间的平移,而使用鼠标左右键拖拽可实现旋转。

// 示例:结合鼠标与键盘实现旋转和平移
void CYourDialog::OnLButtonDown(UINT nFlags, CPoint point)
{
    // 保存鼠标按下时的初始位置,用于计算旋转角度
    // ...

    // 实现旋转操作
    // ...

    CDialogEx::OnLButtonDown(nFlags, point);
}

void CYourDialog::OnKeyDown(UINT nChar, UINT nRepCnt, UINT nFlags)
{
    // 实现平移操作
    // ...

    CDialogEx::OnKeyDown(nChar, nRepCnt, nFlags);
}

5.3 OpenGL基本绘图操作掌握

5.3.1 基本图形的绘制方法

OpenGL提供了多种绘图函数,可以绘制点、线、多边形、三角形等基本图形。基本图形的绘制对于构建更复杂的三维模型至关重要。

// 绘制基本图形示例
glBegin(GL_POINTS); // 开始绘制点集
    glVertex3f(0.0f, 0.0f, 0.0f);
    glVertex3f(1.0f, 0.0f, 0.0f);
    // 添加更多顶点...
glEnd(); // 结束绘制

// 同理,可以使用GL_LINES, GL_LINE_STRIP, GL_LINE_LOOP等绘制线段

5.3.2 颜色、光照和纹理的设置与应用

OpenGL允许程序员自定义颜色、添加光照效果以及应用纹理来增强场景的真实感。通过设置相应的状态和参数,可以得到更为丰富和动态的视觉效果。

// 设置颜色
glColor3f(1.0f, 0.0f, 0.0f); // 红色
glColor4f(1.0f, 1.0f, 0.0f, 0.5f); // 半透明黄色

// 添加光照
glEnable(GL_LIGHTING);
glEnable(GL_LIGHT0);
// 设置光源属性...

// 应用纹理
glBindTexture(GL_TEXTURE_2D, texID);
glBegin(GL_QUADS);
    glTexCoord2f(0.0, 0.0); glVertex3f(-1.0, -1.0,  0.0);
    glTexCoord2f(1.0, 0.0); glVertex3f( 1.0, -1.0,  0.0);
    glTexCoord2f(1.0, 1.0); glVertex3f( 1.0,  1.0,  0.0);
    glTexCoord2f(0.0, 1.0); glVertex3f(-1.0,  1.0,  0.0);
glEnd();

5.3.3 视图和投影变换的调整技巧

视图变换可以改变观察者在场景中的位置和方向,而投影变换则定义了物体的渲染方式。通过调整这些变换可以实现不同的视觉效果。

// 视图变换示例
glMatrixMode(GL_MODELVIEW);
glLoadIdentity(); // 重置变换矩阵
gluLookAt(eyeX, eyeY, eyeZ, // 观察者位置
          centerX, centerY, centerZ, // 观察点位置
          upX, upY, upZ); // 上方向

// 投影变换示例
glMatrixMode(GL_PROJECTION);
glLoadIdentity();
gluPerspective(fovy, aspect, zNear, zFar); // 透视投影

// 平移和旋转变换来调整视图方向
glTranslatef(tx, ty, tz);
glRotatef(angle, x, y, z);

通过掌握OpenGL与MFC集成的方法以及用户输入事件的处理,开发者能够创建出更为交互式的三维应用程序,为用户带来更丰富的视觉体验和操作感受。

本文还有配套的精品资源,点击获取 menu-r.4af5f7ec.gif

简介:OpenGL是一种跨平台编程接口,用于生成二维和三维图像。本教程通过“OpenGL教学程序-选取、平移、旋转”指导初学者掌握OpenGL的基本操作,包括如何在3D空间中选取对象、平移和旋转物体。程序解析了MFC与OpenGL的集成,帮助初学者理解如何将图形用户界面和OpenGL结合,并处理用户输入事件,为进一步的3D图形编程打下基础。


本文还有配套的精品资源,点击获取
menu-r.4af5f7ec.gif

资源下载链接为: https://pan.xunlei.com/s/VOYaEvb5YbXDcdRVMg3ANOaDA1?pwd=sjwe data.py 用于创建数据集。 makelabel.py 的功能是融合数字与背景并保存。其中,一张背景图会在四个象限随机添加一个数字,且几乎无重叠。标签形状为(32,32,11),32×32 是热图输出大小,每个热图像素对应原图 4×4 的方格,每个方格作为分类器,可分出 11 类,0-9 对应数字,10 代表背景。fusion_img 函数将一个数字融合到背景图的随机位置;fusion_4img 函数考虑到单个数字太少,可处理四个数字,输入参数为(背景,(图片 1,标签 1),(图片 2,标签 2)...),输出为图片(0-255)和标签。 model.py 是模型文件,最终占用 192kb 内存。 test.py 为测试脚本,包含两个定义的函数,加载模型后可进行单张测试和视频测试,使用时注释另一个即可。onepoint 函数输入矩阵和点的 xy 坐标,逐行扫描该点周围 6 行的像素,若为 1(表示有物体),就将对应方格的 xy 加入数组并置零。扫描完周围 6 行后,若总点数超过 10 个,判定为一个物体,对所有 xy 分别求平均,得到物体中心。 单张图片后处理过程:获取输出的 32×32×11 矩阵,先扫描 32×32 区域,对每行取 argmax,若不属于背景类,说明可能存在物体,再设阈值过滤部分误识别框,然后将该点值置为 1 作为标记。 再次扫描矩阵时,为避免越界,从第 6 行开始到 25 行结束。若扫描到 1,如(20,20,3)这一格为 1,就取矩阵对应 3 的那一层(32×32 大小),将该矩阵和(20,20)坐标传入 onepoint 函数,返回中心,类别为 3。一般不会误判,若一个数字有两种可能且两种像素数都超 10
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值