基本图像特征是从图像的原始像素值中提取的简单特征,这些特征可以帮助我们理解图像的基本视觉属性。以下是两个基本图像特征的示例:边缘检测和颜色直方图。
1. 边缘检测
边缘是图像中像素值变化剧烈的地方,通常表示物体的边界或纹理变化。边缘检测可以帮助我们识别图像中的物体轮廓和形状。
2. 颜色直方图
颜色直方图是表示图像中不同颜色值的频率分布。它可以帮助我们了解图像中的颜色分布情况,有助于图像分类、检索和分割
请看下面的例子,使用PyTorch实现了图像的特征提取功能,包括边缘检测和颜色直方图。
实例6-15:PyTorch实现图像的边缘检测和颜色直方图功能(源码路径:daima\6\jianzhi.py)
实例文件jianzhi.py的具体实现代码如下所示。
import torch
import cv2
import numpy as np
from torchvision.transforms import ToTensor
from matplotlib import pyplot as plt
# 加载图像
image_path = 'your_image_path.jpg'
image = cv2.imread(image_path)
image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
# 数据预处理
transform = ToTensor()
image_tensor = transform(image_rgb)
# 边缘检测
edges = cv2.Canny(image, threshold1=100, threshold2=200)
edges_tensor = torch.tensor(edges).unsqueeze(0).unsqueeze(0).float()
# 颜色直方图
hist_r = cv2.calcHist([image_rgb], [0], None, [256], [0, 256]).squeeze()
hist_g = cv2.calcHist([image_rgb], [1], None, [256], [0, 256]).squeeze()
hist_b = cv2.calcHist([image_rgb], [2], None, [256], [0, 256]).squeeze()
# 可视化结果
plt.figure(figsize=(12, 4))
plt.subplot(131), plt.imshow(image_rgb)
plt.title('Original Image'), plt.xticks([]), plt.yticks([])
plt.subplot(132), plt.imshow(edges, cmap='gray')
plt.title('Edge Image'), plt.xticks([]), plt.yticks([])
plt.subplot(133)
plt.plot(hist_r, color='r', label='Red')
plt.plot(hist_g, color='g', label='Green')
plt.plot(hist_b, color='b', label='Blue')
plt.title('Color Histogram')
plt.legend()
plt.tight_layout()
plt.show()
上述代码从加载图像开始,通过OpenCV库进行图像处理,使用PyTorch的张量进行数据处理,执行边缘检测,计算颜色直方图,最后通过Matplotlib库进行可视化。这个例子展示了将图像处理与特征提取结合起来,并进行可视化展示的过程。执行效果如图6-8所示。
图6-8 执行效果
下面是一个TensorFlow使用边缘检测和直方图技术制作大型模型的例子,请注意,这只是一个简单的示例,在实际应用中可能需要更复杂的模型和更多的数据处理步骤。
实例6-16:TensorFlow使用边缘检测和直方图技术制作大型模型(源码路径:daima\6\tjianzhi.py)
实例文件tjianzhi.py的具体实现代码如下所示。
import tensorflow as tf
import cv2
import numpy as np
from matplotlib import pyplot as plt
# 加载图像
image_path = 'your_image_path.jpg'
image = cv2.imread(image_path)
image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
# 边缘检测
edges = cv2.Canny(image, threshold1=100, threshold2=200)
# 颜色直方图
hist_r = cv2.calcHist([image_rgb], [0], None, [256], [0, 256]).squeeze()
hist_g = cv2.calcHist([image_rgb], [1], None, [256], [0, 256]).squeeze()
hist_b = cv2.calcHist([image_rgb], [2], None, [256], [0, 256]).squeeze()
# 创建大型模型(示例)
model = tf.keras.Sequential([
tf.keras.layers.Input(shape=image_rgb.shape),
tf.keras.layers.Conv2D(32, (3, 3), activation='relu'),
tf.keras.layers.MaxPooling2D((2, 2)),
tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
tf.keras.layers.MaxPooling2D((2, 2)),
tf.keras.layers.Flatten(),
tf.keras.layers.Dense(128, activation='relu'),
tf.keras.layers.Dense(10, activation='softmax')
])
# 编译模型
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
# 数据预处理
transform = tf.keras.layers.experimental.preprocessing.Rescaling(1./255)
image_tensor = transform(image_rgb[np.newaxis, ...])
# 训练模型(示例)
model.fit(image_tensor, np.array([0]), epochs=1, verbose=0)
# 可视化结果
plt.figure(figsize=(12, 4))
plt.subplot(131), plt.imshow(image_rgb)
plt.title('Original Image'), plt.xticks([]), plt.yticks([])
plt.subplot(132), plt.imshow(edges, cmap='gray')
plt.title('Edge Image'), plt.xticks([]), plt.yticks([])
plt.subplot(133)
plt.plot(hist_r, color='r', label='Red')
plt.plot(hist_g, color='g', label='Green')
plt.plot(hist_b, color='b', label='Blue')
plt.title('Color Histogram')
plt.legend()
plt.tight_layout()
plt.show()
在上述代码中,首先加载了图像,进行边缘检测和颜色直方图计算,然后创建了一个简单的卷积神经网络模型,并使用加载的图像进行训练(在示例中只有一个样本)。最后,通过Matplotlib库绘制了原始图像、边缘图像和颜色直方图。执行效果如图6-8所示。
图6-8 执行效果