Python基于opencv “三维”旋转图片,解决日常小问题

背景

前段时间因为要办理一些事情,需要家里人拍 户口本首页个人所在页的照片用来打印,家里父亲已经年过六旬,能学会玩微信已经实属不易,让父亲用手机拍出很正的图片有点太难,户口本首页拍了有5张以上,里面有一张比较清晰,能凑合着用,但还是不正,于是想着能不能旋转一下,让照片变正。因之前对opencv有所了解,就查找相关文档,然后对图片进行处理,3步即可搞定,最后大功告成!!!

处理对比.png

基于opencv图片处理过程

1.安装opencv

由于opencv为第三方库,需要手动安装一下,安装成功后即可导入使用

pip install opencv-python
2.确定照片上4个点

可以想象一下,把照片看成一个空间,要想把照片旋转正,我们可以拽着户口本首页4个角,给拽到图片的4个角,有点立体的感觉,如下图所示:

确定4个点

确定照片上这4个点的方法比较多,比如:我们可以直接用尺子测量一下、根据截图大小计算一下等。但是作为会编程的人员,我们可以有更好的方法:点击图片上的4个点,可以直接出现相应的位置(x坐标,y坐标)。经过在网上查找了相关的帖子后,opencv就可以实现这个功能,结果如下:

4个点的位置

代码如下:

#加载库
import cv2
import numpy as np

img = cv2.imread('home-1.jpg')
img.shape    #图片尺寸大小
#(1080, 1456, 3)

#定义函数,实现在图片上显示坐标位置
def on_EVENT_LBUTTONDOWN(event, x, y, flags, param):
    if event == cv2.EVENT_LBUTTONDOWN:
        xy = "(%d,%d)" % (x, y)
        print(xy)
        cv2.circle(img, (x, y), 10, (0, 176, 80), thickness = -1)
        if (x+50)>img.shape[1] & x>(img.shape[1]/2):
            cv2.putText(img, xy, (x-180, y-10), cv2.FONT_HERSHEY_PLAIN,2.0, (0,0,255), thickness = 2)
        elif x<50:
            cv2.putText(img, xy, (x, y-10), cv2.FONT_HERSHEY_PLAIN,2.0, (0,0,255), thickness = 2)
        else:
            cv2.putText(img, xy, (x-20, y-10), cv2.FONT_HERSHEY_PLAIN,2.0, (0,0,255), thickness = 2)
        cv2.imshow("image", img)

cv2.namedWindow("image",0)
cv2.resizeWindow("image", 640, 480)
cv2.setMouseCallback("image", on_EVENT_LBUTTONDOWN)
cv2.imshow("image", img)
while(True):
    try:
        cv2.waitKey(10)
    except:
        cv2.destroyWindow("image")
        break
        
cv2.waitKey(10)
cv2.destroyAllWindow()

代码执行过程中,唯一不足一点为,最后需要手动强制退出程序,结束循环。

3.旋转图片

根据上面大概确定好4个点的位置后,下面调用opencv的透视变换函数cv2.warpPerspective,对进行图片旋转,旋转时坐标位置可以根据实际结果进行调节,是否想多显示一点边界,可以调整x,y坐标大小,旋转后效果如下,照片基本算是比较平整,没有出现明显的波纹,打印出来可以用

旋转后图片

代码如下:

import cv2
import numpy as np

img = cv2.imread('home-1.jpg')

#确定位置,旋转前后位置要相互对应,坐标位置可以根据实际来调节
pts1 = np.float32([[202,70],[120,1040],[1415,135],[1435,1055]])   #左上  左下   右上   右下
pts2 = np.float32([[0,0],[0,1080],[1456,0],[1456,1080]])

#进行旋转
M = cv2.getPerspectiveTransform(pts1,pts2)
home_P = cv2.warpPerspective(img,M,(cols,rows))

#保存旋转后的图片
cv2.imwrite("home_P.jpg", home_P, [int(cv2.IMWRITE_JPEG_QUALITY), 100])
  • 参考文章
  1. https://blog.csdn.net/huzhenwei/article/details/82900715
  2. https://segmentfault.com/a/1190000015645951

以上是自己实践中遇到的一些点,分享出来供大家参考学习,欢迎关注本简书号

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
首先,需要导入OpenCV库和NumPy库。 ``` python import cv2 import numpy as np ``` 接着,我们需要定义一个函数来绘制三维坐标轴。该函数需要接受四个参数:图像、旋转向量、平移向量和相机矩阵。 ``` python def draw_axis(img, rvec, tvec, camera_matrix): # 3D 坐标轴的起点 origin = np.zeros((3, 1)) # 3D 坐标轴的终点 axis_points = np.float32([[0.5,0,0], [0,0.5,0], [0,0,0.5]]).reshape(-1,3) # 投影坐标轴点到图像平面 imgpts, jac = cv2.projectPoints(axis_points, rvec, tvec, camera_matrix, None) # 绘制坐标轴 img = cv2.line(img, tuple(imgpts[0].ravel()), tuple(imgpts[1].ravel()), (255,0,0), 3) # X 轴 蓝色 img = cv2.line(img, tuple(imgpts[0].ravel()), tuple(imgpts[2].ravel()), (0,255,0), 3) # Y 轴 绿色 img = cv2.line(img, tuple(imgpts[0].ravel()), tuple(imgpts[3].ravel()), (0,0,255), 3) # Z 轴 红色 return img ``` 其中,`projectPoints` 函数用于将三维坐标点投影到图像平面上,返回的是二坐标点。`cv2.line` 函数用于绘制直线,参数包括起点、终点、颜色和线宽。 接下来,我们可以读取一张图片,并且使用OpenCV的标定函数来获取相机矩阵、畸变系数和旋转向量、平移向量。 ``` python # 读取图片 img = cv2.imread("image.jpg") # 标定图片中的相机参数 criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001) objpoints = [] imgpoints = [] gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) ret, corners = cv2.findChessboardCorners(gray, (9,6), None) if ret == True: objp = np.zeros((6*9,3), np.float32) objp[:,:2] = np.mgrid[0:9,0:6].T.reshape(-1,2) objpoints.append(objp) corners2 = cv2.cornerSubPix(gray,corners,(11,11),(-1,-1),criteria) imgpoints.append(corners2) img = cv2.drawChessboardCorners(img, (9,6), corners2,ret) ret, mtx, dist, rvecs, tvecs = cv2.calibrateCamera(objpoints, imgpoints, gray.shape[::-1],None,None) ``` 最后,我们可以调用 `draw_axis` 函数来绘制三维坐标轴。 ``` python # 绘制坐标轴 img = draw_axis(img, rvecs[0], tvecs[0], mtx) # 显示图片 cv2.imshow("image", img) cv2.waitKey(0) cv2.destroyAllWindows() ``` 完整代码如下: ``` python import cv2 import numpy as np def draw_axis(img, rvec, tvec, camera_matrix): origin = np.zeros((3, 1)) axis_points = np.float32([[0.5,0,0], [0,0.5,0], [0,0,0.5]]).reshape(-1,3) imgpts, jac = cv2.projectPoints(axis_points, rvec, tvec, camera_matrix, None) img = cv2.line(img, tuple(imgpts[0].ravel()), tuple(imgpts[1].ravel()), (255,0,0), 3) # X 轴 蓝色 img = cv2.line(img, tuple(imgpts[0].ravel()), tuple(imgpts[2].ravel()), (0,255,0), 3) # Y 轴 绿色 img = cv2.line(img, tuple(imgpts[0].ravel()), tuple(imgpts[3].ravel()), (0,0,255), 3) # Z 轴 红色 return img img = cv2.imread("image.jpg") criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001) objpoints = [] imgpoints = [] gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) ret, corners = cv2.findChessboardCorners(gray, (9,6), None) if ret == True: objp = np.zeros((6*9,3), np.float32) objp[:,:2] = np.mgrid[0:9,0:6].T.reshape(-1,2) objpoints.append(objp) corners2 = cv2.cornerSubPix(gray,corners,(11,11),(-1,-1),criteria) imgpoints.append(corners2) img = cv2.drawChessboardCorners(img, (9,6), corners2,ret) ret, mtx, dist, rvecs, tvecs = cv2.calibrateCamera(objpoints, imgpoints, gray.shape[::-1],None,None) img = draw_axis(img, rvecs[0], tvecs[0], mtx) cv2.imshow("image", img) cv2.waitKey(0) cv2.destroyAllWindows() ``` 这样就可以在图片上绘制出三维坐标轴了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据人阿多

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值