opencv-图像操作

玉米丛里吃过亏

已于 2023-03-10 13:37:57 修改

阅读量422

点赞数

分类专栏： python 文章标签： opencv python 计算机视觉

于 2023-03-10 13:29:08 首次发布

本文链接：https://blog.csdn.net/y472360651/article/details/129440898

版权

python 专栏收录该内容

99 篇文章 11 订阅

订阅专栏

访问和修改像素值

我们先加载一个彩色图像：

import cv2

img = cv2.imread('b.png')
print(img)

########### 打印结果 ########### 
[[[243 243 243]
  [243 243 243]
  [243 243 243]
  ...
  [243 243 243]
  [243 243 243]
  [243 243 243]]
  
 [[243 243 243]
  [243 243 243]
  [243 243 243]
  ...
  [243 243 243]
  [243 243 243]
  [243 243 243]]]

如果imread()方法中，flags传递值为-1，那么将加载alpha通道，那么最里层的数组长度将会是3，打印结果如下：

[[[243 243 243 255]
  [243 243 243 255]
  [243 243 243 255]
  ...
  [243 243 243 255]
  [243 243 243 255]
  [243 243 243 255]]

 [[243 243 243 255]
  [243 243 243 255]
  [243 243 243 255]
  ...
  [243 243 243 255]
  [243 243 243 255]
  [243 243 243 255]]]

如果传递值为0，那么将加载灰色图像，打印结果将会是这样：

[[243 243 243 ... 243 243 243]
 [243 243 243 ... 243 243 243]
 [243 243 243 ... 243 243 243]
 ...
 [243 243 243 ... 243 243 243]
 [243 243 243 ... 243 243 243]
 [243 243 243 ... 243 243 243]]

我们以彩色图像为例，我们可以通过像素值的行和列坐标来访问它：

px = img[100, 100]
print(type(px), px)         # <class 'numpy.ndarray'> [255 255 255]

# 只访问蓝色像素
px = img[100, 100, 0]
print(type(px), px)         # <class 'numpy.uint8'> 255

我们还可以使用更加优雅的方式来修改它，如下：

# 访问红色像素
px = img.item(100, 100, 2)
print(type(px), px)         # <class 'int'> 255

# 
img.itemset((100, 100, 2), 100)
px = img.item(100, 100, 2)
print(type(px), px)         # <class 'int'> 100

访问图像属性

图像属性包括行数、列数和通道数、图像数据类型、像素数等

shape = img.shape               # 加载彩色图片，返回一个包含行数、列数和通道数的元组
print(type(shape), shape)       # <class 'tuple'> (584, 870, 3)

shape = img.shape               # 加载灰色图片，返回一个包含行数、列数的元组
print(type(shape), shape)       # <class 'tuple'> (584, 870)

shape = img.shape               # 加载alpha通道，返回一个包含行数、列数和通道数的元组
print(type(shape), shape)       # <class 'tuple'> (584, 870, 4)

总像素数由img.size属性获取：

size = img.size
print(type(size), size)         # <class 'int'> 1524240

图像数据类型由img.dtype熟悉获取:

dtype = img.dtype
print(type(dtype), dtype)       # <class 'numpy.dtype[uint8]'> uint8

ROI

这里我们将Baidu的Logo进行修改一下，将"百度"二字，用"Bai"替换，如下：

import cv2
from copy import copy
from matplotlib import pyplot as plt

img1 = cv2.imread('tt.png', 1)
img2 = copy(img1)
img2[90:165, 313: 458] = img2[90:165, 35:180]
# 121, 1行2列第1个通道
plt.subplot(121),plt.imshow(img1, 'gray'),plt.title('img1')
# 122, 1行2列第2个通道
plt.subplot(122),plt.imshow(img2, 'gray'),plt.title('img2')
plt.show()

效果如下：

为图像创建边框

如果需要在图像周围创建边框，例如相框，可以使用cv2.copyMakeBorder()函数。copyMakeBorder(src, top, bottom, left, right, borderType, dst=None, value=None)常用参数解释如下：

src: 输入图像
top, bottom, left, right: 上下左右4个边框宽度，单位:px
borderType: 边框类型
- cv2.BORDER_CONSTANT: 彩色边框
- cv2.BORDER_REFLECT: 边框元素的镜像
- cv2.BORDER_REFLECT_101或cv2.BORDER_DEFAULT
- cv2.BORDER_REPLICATE: 最后一个元素被复制
- cv2.BORDER_WRAP
value: 如果边框类型为cv2.BORDER_CONSTANT的边框颜色

import cv2

img = cv2.imread('tt.png', 1)
# 设置边框颜色为蓝色
img = cv2.copyMakeBorder(img, 5, 5, 5, 5, cv2.BORDER_CONSTANT, value=[255, 0, 0])
cv2.imshow('image', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

图像融合

这也是一种图像加法，但是给图像不同的权重，从而给人一种混合而透明的感觉，我们可以使用cv2.addWeighted()函数来实现。addWeighted(src1, alpha, src2, beta, gamma, dst=None, dtype=None)常用参数解释如下：

src1: 输入图像1
alpha：输入图像1的权重
src2: 输入图像2
beta: 输入图像2的权重
gamma: 标量，用于加到每个和上
dst: 输出图像
dtype

import cv2 
from matplotlib import pyplot as plt

img1 = cv2.imread('img1')
img2 = cv2.imread('img2')
dst = cv2.addWeighted(img1, 0.7, img2, 0.3, 0)
# 131, 1行3列第1个通道
plt.subplot(131),plt.imshow(img1, 'gray'),plt.title('img1')
# 132, 1行3列第2个通道
plt.subplot(132),plt.imshow(img2, 'gray'),plt.title('img2')
# 133, 1行3列第3个通道
plt.subplot(133),plt.imshow(dst, 'gray'),plt.title('dst')
plt.show()

效果如下：

值得注意的是，img1与img2必须行数、列数和通道数一致！！！

为图片添加水印

我们想将opencv的logo放置在给定的背景图的右下方，如果我添加两个图像，它会改变颜色。如果我混合它，我会得到一个透明的效果。但我希望它是不透明的。如果它是一个矩形区域，我可以像上一章那样使用 ROI。但是 OpenCV 徽标不是矩形。所以你可以用按位运算来做到这一点，如下所示：

import cv2 
from matplotlib import pyplot as plt

liushishi = cv2.imread('liushishi.png')
logo = cv2.imread('logo.png')
liushishi_height, liushishi_width = liushishi.shape[:2]
plt.subplot(331),plt.imshow(liushishi, 'gray'),plt.title('liushishi')
logo_height, logo_width = logo.shape[:2]
logo = cv2.resize(logo, (int(0.3 * logo_width), int(0.3 * logo_height)), interpolation=cv2.INTER_CUBIC)
logo_height, logo_width = logo.shape[:2]
roi = liushishi[liushishi_height - logo_height - 15:liushishi_height - 15, liushishi_width - logo_width - 15:liushishi_width - 15]
logo_gray = cv2.cvtColor(logo, cv2.COLOR_BGR2GRAY)
_, mask = cv2.threshold(logo_gray, 230, 255, cv2.THRESH_BINARY)
mask_inv = cv2.bitwise_not(mask)
liushishi_bg_1 = cv2.bitwise_and(roi, roi, mask=mask)
liushishi_bg_2 = cv2.bitwise_and(logo, logo, mask=mask_inv)
dst = cv2.add(liushishi_bg_1, liushishi_bg_2)
liushishi[liushishi_height - logo_height - 15:liushishi_height - 15, liushishi_width - logo_width - 15:liushishi_width - 15] = dst

plt.subplot(332),plt.imshow(logo, 'gray'),plt.title('logo')
plt.subplot(333),plt.imshow(logo_gray, 'gray'),plt.title('logo_gray')
plt.subplot(334),plt.imshow(mask, 'gray'),plt.title('mask')
plt.subplot(335),plt.imshow(mask_inv, 'gray'),plt.title('mask_inv')
plt.subplot(336),plt.imshow(liushishi_bg_1, 'gray'),plt.title('liushishi_bg_1')
plt.subplot(337),plt.imshow(liushishi_bg_2, 'gray'),plt.title('liushishi_bg_2')
plt.subplot(338),plt.imshow(dst, 'gray'),plt.title('dst')
plt.subplot(339),plt.imshow(liushishi, 'gray'),plt.title('liushishi')
plt.show()

效果如下：

请看最后一张图，可以看到，我们的opencv的logo已经放置在图片的右下角了！这里为了方便演示各种操作之后的图片变化，所以将所有的图片都放置在一起展示，有一些色差，我们可以通过cv2.imshow()展示最后操作的背景图，就可以很直观的看到效果了！

这里，我们用到了好几个函数，现在我们来讲一下他们的用法：

resize

修改图片的尺寸。resize(src, dsize, dst=None, fx=None, fy=None, interpolation=None)参数详解如下：

src: 输入图像
dsize: 修改后的图片宽高
dst: 输出图像
fx: 比例因子(宽度)，0.5表示宽度缩放成原来的一半
fy: 比例因子(高度)，0.5表示高度缩放成原来的一半
interpolation: 插值法

cvtColor

该函数将输入图像从一个颜色空间转换为另一个颜色空间。cvtColor(src, code, dst=None, dstCn=None)参数详解如下:

src: 输入图像
code: 颜色空间转换码
dst: 输出图像
dstCn: 目标图像中的通道数

threshold

隔离图像上像素的边缘，上面代码中将大于230像素的值置为0,小于的置为255。threshold(src, thresh, maxval, type, dst=None)参数详解如下:

src: 输入图像
thresh: 阈值
maxval: 使用#THRESH_BINARY和#THRESH_BINARY_INV阈值的最大值
type: 阈值类型
dst: 输出图像

bitwise_not

反转上面的图像创建掩码。bitwise_not(src, dst=None, mask=None)参数详解如下:

src: 输入图像
dst: 输出图像
mask: 掩码

bitwise_and

使用位“与”运算来叠加。bitwise_and(src1, src2, dst=None, mask=None)参数详解如下:

src1: 输入图像1
src2: 输入图像2
dst: 输出图像
mask: 掩码

add

图像叠加。add(src1, src2, dst=None, mask=None, dtype=None)参数详解如下:

src1: 输入图像1
src2: 输入图像2
dst: 输出图像
mask: 掩码

玉米丛里吃过亏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
opencv-图像操作

OpenCV于1999年由加里·布拉斯基(Gary Bradsky)在英特尔创立，并于2000年发布了第一个版本。Vadim Pisarevsky加入Gary Bradsky，管理英特尔俄罗斯软件OpenCV团队。2005年，OpenCV被用于斯坦利，赢得了2005年DARPA大挑战赛。后来，在Gary Bradsky和Vadim Pisarevsky领导的Willow Garage的支持下，该项目继续积极发展。OpenCV现在支持大量与计算机视觉和机器学习相关的算法，并且每天都在扩展。
复制链接

扫一扫