最近初接触图像cv,一切都是从零开始因此遇到了许多问题,故在此记录遇到的问题方便提醒自己也方便后来人不再困惑。
场景:
我们都知道灰度图或者红外图都是单通道图片,而彩色图片是三通道图片。但是当我们用img.shape读取灰度图/红外图片的时候返回的却是三通道结果:
import cv2
img_path = r'灰度图'
img = cv2.imread(img_path)
print(img.shape)
# 如果我将图片灰度处理
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
print(gray.shape)
"""
img.shape返回的结果:
(201, 190, 3)
gray.shape返回的结果:
(201, 190)
"""
问题在于我们直接用opencv 读取图片时似乎都是三通道图片,只有在灰度处理后才回显示单通道。针对这一问题我查了些资料:
opencv在默认情况下会读取3个通道的图像,如果是灰度图/红外图片则会将其图层复制三次(BGR缺省,B==G==R),因此读出来的图片是三通道。
解决:
如果我们想一开始就按照单通道读取灰度图片/红外图片的话,可以在imread()函数中加入相关参数(cv2.IMREAD_GRAYSCALE):
import cv2
img_path = r'灰度图'
img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)
print(img.shape)
"""
img.shape返回的结果:
(201, 190)
"""
这样就会直接按照单通道的方式读取。
需求:
现有一堆彩色图与灰度图混合文件,要求将其分类。
// 借助PIL库, mode为L时即为8位灰度图
Image.mode == 'L'
"""
拓展
1. mode==1: 位图,像素1位
2. mode=='L': 灰度图,像素8位
3. mode=='I': 像素Int32
4. mode=='F': 像素float32
5. mode=='P': 8位,映射为其他模式
6. mode=='RGB': 真色彩,3通道
7. mode=='RGBA': 4通道,加透明度
8. mode=='CMYK': 印刷,4通道
9. mode=='YCbCr': 亮色分离,3通道
"""
在不考虑效率的情况下,我用这种方式处理:
// 不推荐这个方法,推荐用上面的方法。这里感谢评论区“SNOWsama”的指教。
def handle_img(file_path):
for img_path in sorted(glob.glob(file_path + "/*.jpg")):
print("正在处理:" , img_path)
img = Image.open(img_path)
pix = img.convert('RGB')
width = img.size[0]
height = img.size[1]
ir = 0
hd = 0
for x in range(width):
for y in range(height):
r,g,b = pix.getpixel((x,y))
r = int(r)
g = int(g)
b = int(b)
if r==g==b:
ir += 1
else:
hd += 1
if ir > hd:
# 此图片为灰度图
else:
# 此图片为彩色图
注: 此小脚本在我的场景下实现了图片分类,但是尚未大范围测试。该方法只是起到抛砖引玉的作用启发观看者。