本博客代码参考《python计算机视觉编程》的第四章。
1.安装的相关包
在运行书上代码前,需先安装PyGame和P有OpenGL
1.1 PyGame的安装
书后面附录3中的网址中找不到Windows系统使用的Python3.5版本需要的PyGame
所以直接我 pip install pygame,可以用
1.2 PyOpenGL的安装
PyOpenGL的安装不能直接 pip install PyOpenGL PyOpenGL。因为在这种情况下它默认安装的是32位的PyOpenGL,我们在运行测试代码的时候会出现以下的问题
NullFunctionError: Attempt to call an undefined function glutInitDisplayMode, check for bool(glutInitDisplayMode) before calling
所以我们需要去 https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyopengl下载64位的PyOpenGL,cp27代表适用python2.7版本,win32代表32位,win_amd64代表64位,然后安装。
2. 实验过程详解
2.1 用SIFT处理视频
用手机拍摄一段视频,视频时间不宜过长。我拍了三秒,有108帧,大家在拍之前可以先降低视频的分辨率,这样在用SIFT处理视频的每一帧的时候不会等太久,生成的照片也不会太大。
from PCV.localdescriptors import sift
import cv2
def makesift():
cap = cv2.VideoCapture("input.avi")
i = 1
success, frame = cap.read()
while success :
cv2.imwrite('images1/im'+str(i)+'.jpg',frame)
cv2.imwrite('images1/im'+str(i)+'.bmp',frame)
sift.process_image('images1/im'+str(i)+'.jpg', 'images1/im'+str(i)+'.sift',)
l1, d1 = sift.read_features_from_file('images1/im'+str(i)+'.sift')
i=i+1
success, frame = cap.read() #获取下一帧
cap.release()
cv2.destroyAllWindows()
makesift()
2.2 获取照相机标定矩阵
1)测量你选定矩形标定物体的变长dX和dY;
dX=179mm,dY=251mm。
2)将照相机和标定物体放置在平面上,使得计算机的背面和标定物体平行,同时物体位于照相机图现象视图的中心,你可能需要调整照相机或者物体来获得良好的对其效果;如图所拍:
3)测量标定物体到照相机的距离dZ;
dZ=387mm。
4)拍摄一幅图像来检验该设置是否正确,即标定物体的边要和图像的行和列对齐;
5)使用过像素数来侧向标定物体图像的宽度dx和高度dy。
这一步大家可以用美图秀秀里的裁剪,裁剪形状选择矩形。左上方有裁剪出的图像的高度和宽度。因为将书本立起来后书的封面会翻起来,所以我在书的底部放了东西压住它,也就是说实际上这个标定物体的宽度以书下方宽度为准
dx=276mm,dy=367mm。
6)使用下面的相似三角形公式计算出焦距:
得出fx=597,fy=566。
我们要注意的是,我们现在获取的焦距是在特定图像分辨率下计算出来的,在本次实验中,实验的图像的分辨率是600X800。
所以我们得到的标定矩阵如下:
2.3 增强现实的实现
2.3.1 从照相机矩阵到OpenGL格式
因为OpenGL使用4X4矩阵来表示变换。这和我们使用的3X4照相机矩阵略有区别。我们需要转换。
def set_projection_from_camera(K):
"从照相机标定矩阵中获得视图"
glMatrixMode(GL_PROJECTION)
glLoadIdentity()
fx = K[0,0]
fy = K[1,1]
fovy = 2*math.atan(0.5*height/fy)*180/math.pi
aspect = (width*fy)/(height*fx)
#定义近的和远的裁剪平面
near = 0.1
far = 100.0
#设定透视
gluPerspective(fovy,aspect,near,far