这本是学校的一次大作业(北京交通大学-计算机学院-数字图像处理[本])。搜索网上的资料大多是介绍BMP文件的二进制底层格式,但是很少实际读、改、写的代码实现。将这篇博客整理出来就是为了填补空白。
第一次写博客,如有错误,请多多包涵。希望为提高中文互联网环境资源质量贡献出绵薄之力。
文章目录
前言
本文章主要介绍BMP(bitmap)图片文件格式的二进制组成,以及基于该标准按字节的文件读取、修改和写入操作,并辅以相应的Python代码实现解释。另外还相应制作了一个GUI界面。
修改操作这里使用了数字图像处理的三个基本方法:1)直方图均衡化;2)均值滤波;3)中值滤波。本文提供的代码中,这三个操作均是在灰度图上操作的,即把彩色图读入后,变换为灰度图,再进行操作。这里抛砖引玉,有兴趣的同学可以探究彩色图的上述算法实现。
代码需要引用的库如下:
import numpy as np
from struct import unpack
from PIL import Image, ImageTk
import sys
import tkinter
import tkinter.filedialog
好了,下面正式开始讲解BMP文件。
1. BMP图片格式及其读写
BMP格式图片的数据分为以下部分:
内容 | 大小 |
---|---|
bmp文件头(bmp file header) | 14字节 |
位图信息头(bitmap information) | 40字节 |
调色板(color palette) | 可选 |
位图数据 |
这里使用Lenna的BMP格式图片的十六进制码作为解读用例。
1.1. BMP文件头内容读取
BMP文件头内容如下:
内容 | 大小 | 偏移 | Lenna图片 | 备注 |
---|---|---|---|---|
bfType 文件类型 | 2字节 | 0x00 | 0x4D42 | 字符显示就是“BM” |
bfSize 文件大小 | 4字节 | 0x02 | 0x00010438 | |
bfReserved1 保留 | 2字节 | 0x06 | 0x00 | 必须设置为0 |
bfReserved2 保留 | 2字节 | 0x08 | 0x00 | 必须设置为0 |
bfOffBits 从头到位图数据的偏移 | 4字节 | 0x0A | 0x00000436 | = 文件头大小 + 位图信息头大小 + 调色板大小 |
Lenna图片中数据如下图(使用VS Code的Hex Editor打开):
因此读取代码为:
class BmpData:
def __init__(self, file_path:str):
with open(file_path, "rb") as file:
self.file = file
self.bfType = unpack("<H", file.read(2))[0] # 0x00 文件类型
self.bfSize = unpack("<i", file.read(4))[0] # 0x02 文件大小
self.bfReserved1 = unpack("<H", file.read(2))[0] # 0x06 保留,必须设置为0
self.bfReserved2 = unpack("<H", file.read(2))[0] # 0x08 保留,必须设置为0
self.bfOffBits = unpack("<i", file.read(4))[0] # 0x0a 从头到位图数据的偏移
1.2. BMP文件头内容读取
BMP位图信息头内容如下:
内容 | 大小 | 偏移 | Lenna图片 | 备注 |
---|---|---|---|---|
biSize 信息头的大小 | 4字节 | 0x0E | 0x00000028 | |
biWidth 图像的宽度(以像素为单位) | 4字节 | 0x12 | 0x00000100 | |
biHeight 图像的高度(以像素为单位) | 4字节 | 0x16 | 0x00000100 | 如果是正的,说明图像是倒立的;反之正立 |
biPlanes 颜色平面数 | 2字节 | 0x1A | 0x0001 | |
biBitCount 每像素的比特数 | 2字节 | 0x1C | 0x0008 | |
biCompression 压缩类型 | 4字节 | 0x1E | 0x00000000 | |
biSizeImage 位图数据的大小 | 4字节 | 0x22 | 0x00000000 | = 文件大小 - 位图偏移bfOffBits,用BI_RGB格式时可设置为0 |
biXPelsPerMeter 水平分辨率 | 4字节 | 0x26 | 0x00000B12 | 单位是像素/米,有符号整数 |
biYPelsPerMeter 垂直分辨率 | 4字节 | 0x2A | 0x00000B12 | 单位是像素/米,有符号整数 |
biClrUsed 位图使用的调色板中的颜色索引数 | 4字节 | 0x2E | 0x00000000 | 如果是0,说明使用所有颜色 |
biClrImportant 对图像显示有重要影响的颜色索引数 | 4字节 | 0x32 | 0x00000000 | 如果是0,说明都重要 |
Lenna图片中数据如下图:
因此读取代码为:
# 直接接上一段代码,在BmpData.__init__()内
self.biSize = unpack("<i", file.read(4))[0] # 0x0e 信息头的大小
self.biWidth = unpack("<i", file.read(4))[0] # 0x12 图像的宽度(以像素为单位)
self.biHeight = unpack("<i", file.read(4))[0] # 0x16 图像的高度(以像素为单位)(负说明图像是倒立的)
self.biPlanes = unpack("<H", file.read(2))[0] # 0x1a 颜色平面数
self.biBitCount = unpack("<H", file.read(2))[0] # 0x1c 比特数/像素数
self.biCompression = unpack("<i", file.read(4))[0] # 0x1e 压缩类型
self.biSizeImage = unpack("<i", file.read(4))[0] # 0x22 位图数据的大小
self.biXPelsPerMeter = unpack("<i", file.read(4))[0] # 0x26 水平分辨率
self.biYPelsPerMeter = unpack("<i", file.read(4))[0] # 0x2a 垂直分辨率
self.biClrUsed = unpack("<i", file.read(4))[0] # 0x2e 位图使用的调色板中的颜色索引数
self.biClrImportant = unpack("<i", file.read(4))[0] # 0x32 对图像显示有重要影响的颜色索引数(0说明都重要)
1.3. BMP调色板读取
调色板是可选的,不过这里的8位色图有调色板。那么接下来的数据就是调色板了。
调色板就是一个颜色的索引,这里是8位色图,一共有256中颜色,由于每个颜色都有RGB三原色,也就是要3个字节表示,这样的话256个颜色就不能表示所有的颜色。
所以需要一个索引,用一个字节的索引指向4个字节表示的颜色(B/G/R/Alpha四个值)。一个颜色用4个字节表示,有N个颜色,那么调色板就是一个N*4的二维数组。
Lenna图片中数据如下图:
调色板数据较长,这里只截了一部分。
可以看出,调色板从0x36开始,是0x00到0xFF顺序排列的B/G/R/Alpha四个值。
不完全列举如下:
范围 | 颜色编号 | B | G | R | Alpha |
---|---|---|---|---|---|
0x36 - 0x39 | 0 | 0x00 | 0x00 | 0x00 | 0x00 |
0x3A - 0x3D | 1 | 0x01 | 0x01 | 0x01 | 0x01 |
0x3E - 0x41 | 2 | 0x02 | 0x02 | 0x02 | 0x02 |
0x0042 - 0x0431 | 3 - 254 | … | … | … | … |
0x0432 - 0x0435 | 255 | 0xFF | 0xFF | 0xFF | 0xFF |
这里使用的Lenna图片是黑白的,即每个像素中的RGB三个值相等,可以视为都等于灰度。
这里0x00到0xFF即0到255,能够覆盖所有灰度范围。如果每像素的比特数biBitCount不足8位,那么调色板就不能覆盖所有256个灰度,那么说明图片里没有用到的颜色不会出现在调色板里。
因此读取代码为:
# 这一段是BmpData类的方法,在BmpData.__init__()内被调用获取调色盘
def get_color_palette(self) -> np.ndarray:
if (self.bfOffBits == 0x36): # 16/24位图像不需要调色板,起始位置就等于0x36
return None
color_alette_size = 1 << int(self.biBitCount) # 多少字节调色板颜色就有2^n个
color_palette = np.zeros((color_alette_size, 3), dtype=np.int32)
self.file.seek(0x36)
for i in range(color_alette_size):
b = unpack("B", self.file.read(1))[0]
g = unpack("B", self.file.read(1))[0]
r = unpack("B", self.file.read(1))[0]
alpha = unpack("B", self.file.read(1))[0]
color_palette[i][0] = b
color_palette[i][1] = g
color_palette[i][2] = r
return color_palette
1.4. BMP位图数据读取
接下来是位图数据。由于是8位色图,所以每个像素用1个字节表示,取出每个字节,从调色盘中获取对应的R/G/B/Alpha数值,忽略掉Alpha值,放入三维数组中,就是图片数据了。如果是24位色图,按照BGR的顺序排列,32位色图按照BGRAlpha排列。
读取颜色值的代码如下:
# 这一段也是BmpData类的方法,在下一段代码BmpData.get_numpy_img()内被调用获取像素点的RGB值
def get_RGB(self, pixel_data:str):
if len(pixel_data) <= 8:
color_index = int(pixel_data, 2)
return self.color_palette[color_index]
elif len(pixel_data) == 16:
b = int(pixel_data[1:6], 2) * 8
g = int(pixel_data[6:11], 2) * 8
r = int(pixel_data[11:16], 2) * 8
return [r, g, b]
elif len(pixel_data) == 24:
b = int(pixel_data[0:8], 2)
g = int(pixel_data[8:16], 2)
r = int(pixel_data[16:24], 2)
return [r, g, b]
elif len(pixel_data) == 32:
b = int(pixel_data[0:8], 2)
g = int(pixel_data[8:16], 2)
r = int(pixel_data[16:24], 2)
alpha = int(pixel_data[24:32], 2)
return [r, g, b]
Lenna图片的biHeight为正数,说明图像倒立,从左下角开始到右上角,以行为主序排列。
位图数据排列还有一个规则,就是对齐。
Windows默认的扫描的最小单位是4字节,如果数据对齐满足这个值的话对于数据的获取速度等都是有很大的增益的。因此,BMP图像顺应了这个要求,要求每行的数据的长度必须是4的倍数,如果不够需要以0填充,这样可以达到按行的快速存取。
每行的的长度为:
R
o
w
s
i
z
e
=
4
×
⌈
b
f
O
f
f
B
i
t
s
×
b
i
W
i
d
t
h
32
⌉
Rowsize = 4 \times \left \lceil \frac{bfOffBits \times biWidth}{32} \right \rceil
Rowsize=4×⌈32bfOffBits×biWidth⌉
用代码实现为:
Rowsize = ((biWidth * biBitCount + 31) >> 5) << 2
补零的数量就为:
R
o
w
s
i
z
e
=
4
×
⌈
b
f
O
f
f
B
i
t
s
×
b
i
W
i
d
t
h
32
⌉
−
(
b
f
O
f
f
B
i
t
s
×
b
i
W
i
d
t
h
)
Rowsize = 4 \times \left \lceil \frac{bfOffBits \times biWidth}{32} \right \rceil - (bfOffBits \times biWidth)
Rowsize=4×⌈32bfOffBits×biWidth⌉−(bfOffBits×biWidth)
获取图片三维数组的代码如下:
# 这一段是BmpData类的方法,在BmpData.__init__()内被调用获取位图数据
def get_numpy_img(self) -> np.ndarray:
biHeight = abs(self.biHeight)
img_np = np.zeros((biHeight, self.biWidth, 3), dtype=np.int32)
self.file.seek(self.bfOffBits)
for x in range(biHeight):
row_byte_count = ((self.biWidth * self.biBitCount + 31) >> 5) << 2
row_bits = self.file.read(row_byte_count)
row_bits = ''.join(format(byte, '08b') for byte in row_bits)
for y in range(self.biWidth):
pixel_data = row_bits[y * self.biBitCount: (y + 1) * self.biBitCount]
if self.biHeight > 0: # 图像倒立
img_np[biHeight - 1 - x][y] = self.get_RGB(pixel_data)
else:
img_np[x][y] = self.get_RGB(pixel_data)
return img_np
1.5. BMP图片的写入
将图片三维数组按照BMP格式写入二进制文件即可。这里我以8位色图写入。
# 这一段是BmpData类的方法,用于在外部调用写入和保存修改后的图片
def save_img(self, image:np.ndarray, save_path:str):
with open(save_path, "wb") as file:
file.write(int(self.bfType).to_bytes(2, byteorder='little')) # 0x00 文件类型
file.write(int(0x36 + 0x100 * 4 + self.biWidth * abs(self.biHeight)).to_bytes(4, byteorder='little')) # 0x02 文件大小
file.write(int(0).to_bytes(4, byteorder='little')) # 0x06 保留,必须设置为0
file.write(int(0x36 + 0x100 * 4).to_bytes(4, byteorder='little')) # 0x0a 从头到位图数据的偏移
file.write(int(40).to_bytes(4, byteorder='little')) # 0x0e 信息头的大小
file.write(int(self.biWidth).to_bytes(4, byteorder='little')) # 0x12 图像的宽度
file.write(int(self.biHeight).to_bytes(4, byteorder='little')) # 0x16 图像的高度
file.write(int(self.biPlanes).to_bytes(2, byteorder='little')) # 0x1a 颜色平面数
file.write(int(8).to_bytes(2, byteorder='little')) # 0x1c 比特数/像素数
file.write(int(self.biCompression).to_bytes(4, byteorder='little')) # 0x1e 压缩类型
file.write(int(self.biSizeImage).to_bytes(4, byteorder='little')) # 0x22 位图数据的大小
file.write(int(self.biXPelsPerMeter).to_bytes(4, byteorder='little')) # 0x26 水平分辨率
file.write(int(self.biYPelsPerMeter).to_bytes(4, byteorder='little')) # 0x2a 垂直分辨率
file.write(int(0x100 * 4).to_bytes(4, byteorder='little')) # 0x2e 位图使用的调色板中的颜色索引数
file.write(int(0).to_bytes(4, byteorder='little')) # 0x32 对图像显示有重要影响的颜色索引数
for i in range(256): # 调色板
file.write(int(i).to_bytes(1, byteorder='little'))
file.write(int(i).to_bytes(1, byteorder='little'))
file.write(int(i).to_bytes(1, byteorder='little'))
file.write(int(0).to_bytes(1, byteorder='little'))
for x in range(abs(self.biHeight)): # 位图数据
for y in range(self.biWidth):
if self.biHeight > 0:
file.write(int(image[self.biHeight - 1 - x][y]).to_bytes(1, byteorder='little'))
else:
file.write(int(image[x][y]).to_bytes(1, byteorder='little'))
file.write(b'0' * ((((self.biWidth * 8 + 31) >> 5) << 2) - 8 * self.biWidth))
file.close()
2. 图片修改
在BmpData.__init__()
中,我们已经得到了读取的BMP文件的位图数据,以一个
H
e
i
g
h
t
×
W
i
d
d
t
h
×
3
Height \times Widdth \times 3
Height×Widdth×3 的numpy数组的形式保存。基于这个数组,我们可以进行修改,然后调用上一节中的BmpData.save_img()
保存。
2.1. 灰度化
在前言中已经提到,这里的修改是基于灰度图的。首先我们需要把 H e i g h t × W i d d t h × 3 Height \times Widdth \times 3 Height×Widdth×3 的RGB数组转化为 H e i g h t × W i d d t h Height \times Widdth Height×Widdth 的灰度图。
这里灰度化的方法采用
g
r
e
y
v
a
l
u
e
=
0.299
×
R
+
0.587
×
G
+
0.114
×
B
grey\space value=0.299\times R + 0.587 \times G + 0.114\times B
grey value=0.299×R+0.587×G+0.114×B
灰度转化代码如下:
# 这一段是BmpData类的方法,在BmpData.__init__()内被调用获取灰度图
def get_gray_img(self) -> np.ndarray:
biHeight = abs(self.biHeight)
gray_img = np.dot(self.img_np.reshape((biHeight * self.biWidth, 3)).astype(np.float32),
[0.299, 0.587, 0.114]).astype(np.int32)
gray_img = gray_img.reshape((biHeight, self.biWidth))
return gray_img
2.2. 直方图均衡化
直方图均衡化的步骤如下:
- 将彩色图转换为灰度图;
- 统计每个色阶的像素数,转换为频率;
- 将各个色阶的频率依次累加,得到前缀和;
- 将各个色阶的频率前缀和转换到相近的灰度色阶值,作为该色阶内像素的均衡化后的灰度值;
- 将原图的各个像素变换到对应得到灰度值。
按照步骤,均衡化代码如下:
# 这一段是BmpData类的方法,用于在外部调用进行直方图均衡化
def equalize(self, level:int):
biHeight = abs(self.biHeight)
self.hist = np.zeros(256, dtype=np.int32)
max_value = self.gray.max()
min_value = self.gray.min()
gap = (max_value - min_value + 1) / level
for x in range(biHeight):
for y in range(self.biWidth):
self.hist[self.gray[x, y]] += 1
hist = np.zeros(level, dtype=np.float32)
for i in range(level):
hist[i] = np.sum(self.hist[min_value + int(i * gap) : min_value + int((i + 1) * gap)])
hist /= biHeight * self.biWidth
for i in range(1, level):
hist[i] += hist[i - 1]
hist *= level
hist = np.around(hist)
hist /= level
hist = np.floor(hist * 255).astype(np.int32)
self.equalized_img = np.zeros_like(self.gray)
self.equalized_hist = np.zeros(256, dtype=np.int32)
for x in range(biHeight):
for y in range(self.biWidth):
self.equalized_img[x, y] = hist[int((self.gray[x, y] - min_value) / gap)]
self.equalized_hist[self.equalized_img[x, y]] += 1
return self.equalized_img, self.hist, self.equalized_hist
2.3. 均值滤波
均值滤波就是将图片中某一像素点的值用该点和其周围九宫格内的八个点的均值来替代。这样可以有效滤去高斯噪声。
如果直接进行滤波,滤波结果尺寸将会缩减为 ( o r i g i n a l H e i g h t − 2 ) × ( o r i g i n a l W i d t h − 2 ) (originalHeight - 2) \times (originalWidth - 2) (originalHeight−2)×(originalWidth−2) 。因此,需要先将原图像填充至 ( o r i g i n a l H e i g h t + 2 ) × ( o r i g i n a l W i d t h + 2 ) (originalHeight + 2) \times (originalWidth + 2) (originalHeight+2)×(originalWidth+2) ,再进行滤波,滤波后的尺寸才能保持 o r i g i n a l H e i g h t × o r i g i n a l W i d t h originalHeight \times originalWidth originalHeight×originalWidth 。
这里填充的内容选择重复原图片边缘的像素点。
代码实现如下:
# 这一段是BmpData类的方法,用于在外部调用进行均值滤波
def meanfilter(self):
self.meanfiltered_img = np.zeros_like(self.gray)
padded_img = np.zeros((abs(self.biHeight) + 2, self.biWidth + 2), dtype=np.int16)
padded_img[1:-1, 1:-1] = self.gray
padded_img[0, 1:-1] = self.gray[0, :]
padded_img[-1, 1:-1] = self.gray[-1, :]
padded_img[1:-1, 0] = self.gray[:, 0]
padded_img[1:-1, -1] = self.gray[:, -1]
padded_img[0][0] = self.gray[0][0]
padded_img[0][-1] = self.gray[0][-1]
padded_img[-1][0] = self.gray[-1][0]
padded_img[-1][-1] = self.gray[-1][-1]
for x in range(abs(self.biHeight)):
for y in range(self.biWidth):
self.meanfiltered_img[x][y] = np.around(np.mean(padded_img[x:x+3, y:y+3]))
return self.meanfiltered_img
2.4. 中值滤波
中值滤波就是将图片中某一像素点的值用该点和其周围九宫格内的八个点的中值来替代。这样可以有效滤去椒盐噪声。
填充的方法与均值滤波相同。
代码实现如下:
# 这一段是BmpData类的方法,用于在外部调用进行中值滤波
def medianfilter(self):
self.medianfiltered_img = np.zeros_like(self.gray)
padded_img = np.zeros((abs(self.biHeight) + 2, self.biWidth + 2), dtype=np.int16)
padded_img[1:-1, 1:-1] = self.gray
padded_img[0, 1:-1] = self.gray[0, :]
padded_img[-1, 1:-1] = self.gray[-1, :]
padded_img[1:-1, 0] = self.gray[:, 0]
padded_img[1:-1, -1] = self.gray[:, -1]
padded_img[0][0] = self.gray[0][0]
padded_img[0][-1] = self.gray[0][-1]
padded_img[-1][0] = self.gray[-1][0]
padded_img[-1][-1] = self.gray[-1][-1]
for x in range(abs(self.biHeight)):
for y in range(self.biWidth):
self.medianfiltered_img[x][y] = np.around(np.median(padded_img[x:x+3, y:y+3]))
return self.medianfiltered_img
3. GUI界面实现
这里使用Python自带的tkinter库,具体代码见附录,实现逻辑就不多赘述。
4. 实验
4.1. 打包可执行文件
将Python文件(完整代码见附录)打包成exe文件运行。
在命令行中配置环境并封装:
pip install pyinstaller
Pyinstaller -F -w read_bmp.py
在文件资源管理器窗口中双击exe文件,即可运行。文件较大,打开时间可能会比较长。
4.2. 加噪声
对原始图片加噪声,以验证均值滤波、中值滤波的有效性。
这里提供添加高斯噪声和椒盐噪声的Python脚本:
import skimage
from PIL import Image
import numpy as np
if __name__ == '__main__':
origin = skimage.img_as_float(Image.open('./test_images/my_image_normal.bmp'))
noisy = skimage.util.random_noise(origin, mode='gaussian', var=0.01) # var参数可改,越大越模糊(方差越大)
noisy = (noisy * 255).astype(np.uint8)
skimage.io.imsave('./test_images/my_image_gaussiannoise.bmp', noisy)
origin = skimage.img_as_float(Image.open('./test_images/my_image_normal.bmp'))
noisy = skimage.util.random_noise(origin, mode='salt')
noisy = (noisy * 255).astype(np.uint8)
skimage.io.imsave('./test_images/my_image_saltnoise.bmp', noisy)
实验大致结果和结论:
- 均值滤波可以有效滤除图像中的高斯噪声,它通过用像素点周围区域的平均值来替代该像素点的值,由于高斯噪声具有零均值的特点,所以能够有效地减弱噪声;
- 中值滤波可以有效去除图像中的椒盐噪声,它通过用像素点周围区域的中值来替代该像素点的值,由于椒盐噪声往往处于区域灰度值的两端,使用中值可以将其排除在外。
均值滤波对正常图像会造成一定的模糊,而中值滤波可以很好地保持边缘细节。所以在不需要强烈平滑图像的情况下,中值滤波更好。当图像包含不同类型的噪声时,需要权衡使用均值滤波还是中值滤波。
附录(完整源码)
import numpy as np
from struct import unpack
from PIL import Image, ImageTk
import sys
import tkinter
import tkinter.filedialog
class BmpData:
def __init__(self, file_path:str):
with open(file_path, "rb") as file:
self.file = file
self.bfType = unpack("<H", file.read(2))[0] # 0x00 文件类型
self.bfSize = unpack("<i", file.read(4))[0] # 0x02 文件大小
self.bfReserved1 = unpack("<H", file.read(2))[0] # 0x06 保留,必须设置为0
self.bfReserved2 = unpack("<H", file.read(2))[0] # 0x08 保留,必须设置为0
self.bfOffBits = unpack("<i", file.read(4))[0] # 0x0a 从头到位图数据的偏移
self.biSize = unpack("<i", file.read(4))[0] # 0x0e 信息头的大小
self.biWidth = unpack("<i", file.read(4))[0] # 0x12 图像的宽度(以像素为单位)
self.biHeight = unpack("<i", file.read(4))[0] # 0x16 图像的高度(以像素为单位)(负说明图像是倒立的)
self.biPlanes = unpack("<H", file.read(2))[0] # 0x1a 颜色平面数
self.biBitCount = unpack("<H", file.read(2))[0] # 0x1c 比特数/像素数
self.biCompression = unpack("<i", file.read(4))[0] # 0x1e 压缩类型
self.biSizeImage = unpack("<i", file.read(4))[0] # 0x22 位图数据的大小
self.biXPelsPerMeter = unpack("<i", file.read(4))[0] # 0x26 水平分辨率
self.biYPelsPerMeter = unpack("<i", file.read(4))[0] # 0x2a 垂直分辨率
self.biClrUsed = unpack("<i", file.read(4))[0] # 0x2e 位图使用的调色板中的颜色索引数
self.biClrImportant = unpack("<i", file.read(4))[0] # 0x32 对图像显示有重要影响的颜色索引数(0说明都重要)
self.color_palette = self.get_color_palette()
self.img_np = self.get_numpy_img()
self.gray = self.get_gray_img()
file.close()
def get_color_palette(self) -> np.ndarray:
if (self.bfOffBits == 0x36): # 16/24位图像不需要调色板,起始位置就等于0x36
return None
color_alette_size = 1 << int(self.biBitCount) # 多少字节调色板颜色就有2^n个
color_palette = np.zeros((color_alette_size, 3), dtype=np.int32)
self.file.seek(0x36)
for i in range(color_alette_size):
b = unpack("B", self.file.read(1))[0]
g = unpack("B", self.file.read(1))[0]
r = unpack("B", self.file.read(1))[0]
alpha = unpack("B", self.file.read(1))[0]
color_palette[i][0] = b
color_palette[i][1] = g
color_palette[i][2] = r
return color_palette
def get_numpy_img(self) -> np.ndarray:
biHeight = abs(self.biHeight)
img_np = np.zeros((biHeight, self.biWidth, 3), dtype=np.int32)
self.file.seek(self.bfOffBits)
for x in range(biHeight):
row_byte_count = ((self.biWidth * self.biBitCount + 31) >> 5) << 2
row_bits = self.file.read(row_byte_count)
row_bits = ''.join(format(byte, '08b') for byte in row_bits)
for y in range(self.biWidth):
pixel_data = row_bits[y * self.biBitCount: (y + 1) * self.biBitCount]
if self.biHeight > 0: # 图像倒立
img_np[biHeight - 1 - x][y] = self.get_RGB(pixel_data)
else:
img_np[x][y] = self.get_RGB(pixel_data)
return img_np
def get_gray_img(self) -> np.ndarray:
biHeight = abs(self.biHeight)
gray_img = np.dot(self.img_np.reshape((biHeight * self.biWidth, 3)).astype(np.float32),
[0.299, 0.587, 0.114]).astype(np.int32)
gray_img = gray_img.reshape((biHeight, self.biWidth))
return gray_img
def get_RGB(self, pixel_data:str):
if len(pixel_data) <= 8:
color_index = int(pixel_data, 2)
return self.color_palette[color_index]
elif len(pixel_data) == 16:
b = int(pixel_data[1:6], 2) * 8
g = int(pixel_data[6:11], 2) * 8
r = int(pixel_data[11:16], 2) * 8
return [r, g, b]
elif len(pixel_data) == 24:
b = int(pixel_data[0:8], 2)
g = int(pixel_data[8:16], 2)
r = int(pixel_data[16:24], 2)
return [r, g, b]
elif len(pixel_data) == 32:
b = int(pixel_data[0:8], 2)
g = int(pixel_data[8:16], 2)
r = int(pixel_data[16:24], 2)
alpha = int(pixel_data[24:32], 2)
return [r, g, b]
def equalize(self, level:int):
biHeight = abs(self.biHeight)
self.hist = np.zeros(256, dtype=np.int32)
max_value = self.gray.max()
min_value = self.gray.min()
gap = (max_value - min_value + 1) / level
for x in range(biHeight):
for y in range(self.biWidth):
self.hist[self.gray[x, y]] += 1
hist = np.zeros(level, dtype=np.float32)
for i in range(level):
hist[i] = np.sum(self.hist[min_value + int(i * gap) : min_value + int((i + 1) * gap)])
hist /= biHeight * self.biWidth
for i in range(1, level):
hist[i] += hist[i - 1]
hist *= level
hist = np.around(hist)
hist /= level
hist = np.floor(hist * 255).astype(np.int32)
self.equalized_img = np.zeros_like(self.gray)
self.equalized_hist = np.zeros(256, dtype=np.int32)
for x in range(biHeight):
for y in range(self.biWidth):
self.equalized_img[x, y] = hist[int((self.gray[x, y] - min_value) / gap)]
self.equalized_hist[self.equalized_img[x, y]] += 1
return self.equalized_img, self.hist, self.equalized_hist
def save_equalized_img(self, save_path:str):
self.save_img(image=self.equalized_img, save_path=save_path)
def medianfilter(self):
self.medianfiltered_img = np.zeros_like(self.gray)
padded_img = np.zeros((abs(self.biHeight) + 2, self.biWidth + 2), dtype=np.int16)
padded_img[1:-1, 1:-1] = self.gray
padded_img[0, 1:-1] = self.gray[0, :]
padded_img[-1, 1:-1] = self.gray[-1, :]
padded_img[1:-1, 0] = self.gray[:, 0]
padded_img[1:-1, -1] = self.gray[:, -1]
padded_img[0][0] = self.gray[0][0]
padded_img[0][-1] = self.gray[0][-1]
padded_img[-1][0] = self.gray[-1][0]
padded_img[-1][-1] = self.gray[-1][-1]
for x in range(abs(self.biHeight)):
for y in range(self.biWidth):
self.medianfiltered_img[x][y] = np.around(np.median(padded_img[x:x+3, y:y+3]))
return self.medianfiltered_img
def save_medianfiltered_img(self, save_path:str):
self.save_img(image=self.medianfiltered_img, save_path=save_path)
def meanfilter(self):
self.meanfiltered_img = np.zeros_like(self.gray)
padded_img = np.zeros((abs(self.biHeight) + 2, self.biWidth + 2), dtype=np.int16)
padded_img[1:-1, 1:-1] = self.gray
padded_img[0, 1:-1] = self.gray[0, :]
padded_img[-1, 1:-1] = self.gray[-1, :]
padded_img[1:-1, 0] = self.gray[:, 0]
padded_img[1:-1, -1] = self.gray[:, -1]
padded_img[0][0] = self.gray[0][0]
padded_img[0][-1] = self.gray[0][-1]
padded_img[-1][0] = self.gray[-1][0]
padded_img[-1][-1] = self.gray[-1][-1]
for x in range(abs(self.biHeight)):
for y in range(self.biWidth):
self.meanfiltered_img[x][y] = np.around(np.mean(padded_img[x:x+3, y:y+3]))
return self.meanfiltered_img
def save_meanfiltered_img(self, save_path:str):
self.save_img(image=self.meanfiltered_img, save_path=save_path)
def save_img(self, image:np.ndarray, save_path:str):
with open(save_path, "wb") as file:
file.write(int(self.bfType).to_bytes(2, byteorder='little')) # 0x00 文件类型
file.write(int(0x36 + 0x100 * 4 + self.biWidth * abs(self.biHeight)).to_bytes(4, byteorder='little')) # 0x02 文件大小
file.write(int(0).to_bytes(4, byteorder='little')) # 0x06 保留,必须设置为0
file.write(int(0x36 + 0x100 * 4).to_bytes(4, byteorder='little')) # 0x0a 从头到位图数据的偏移
file.write(int(40).to_bytes(4, byteorder='little')) # 0x0e 信息头的大小
file.write(int(self.biWidth).to_bytes(4, byteorder='little')) # 0x12 图像的宽度
file.write(int(self.biHeight).to_bytes(4, byteorder='little')) # 0x16 图像的高度
file.write(int(self.biPlanes).to_bytes(2, byteorder='little')) # 0x1a 颜色平面数
file.write(int(8).to_bytes(2, byteorder='little')) # 0x1c 比特数/像素数
file.write(int(self.biCompression).to_bytes(4, byteorder='little')) # 0x1e 压缩类型
file.write(int(self.biSizeImage).to_bytes(4, byteorder='little')) # 0x22 位图数据的大小
file.write(int(self.biXPelsPerMeter).to_bytes(4, byteorder='little')) # 0x26 水平分辨率
file.write(int(self.biYPelsPerMeter).to_bytes(4, byteorder='little')) # 0x2a 垂直分辨率
file.write(int(0x100 * 4).to_bytes(4, byteorder='little')) # 0x2e 位图使用的调色板中的颜色索引数
file.write(int(0).to_bytes(4, byteorder='little')) # 0x32 对图像显示有重要影响的颜色索引数
for i in range(256):
file.write(int(i).to_bytes(1, byteorder='little'))
file.write(int(i).to_bytes(1, byteorder='little'))
file.write(int(i).to_bytes(1, byteorder='little'))
file.write(int(0).to_bytes(1, byteorder='little'))
for x in range(abs(self.biHeight)):
for y in range(self.biWidth):
if self.biHeight > 0:
file.write(int(image[self.biHeight - 1 - x][y]).to_bytes(1, byteorder='little'))
else:
file.write(int(image[x][y]).to_bytes(1, byteorder='little'))
file.write(b'0' * ((((self.biWidth * 8 + 31) >> 5) << 2) - 8 * self.biWidth))
file.close()
def choosepic():
global path_
path_ = tkinter.filedialog.askopenfilename(title='请选择图片文件', filetypes=[('图片', '.bmp')])
if path_ == '':
return
img_temp = Image.open(path_).resize((int(256 * 0.8), int(256 * 0.8))) # 图片读取和加载
img = ImageTk.PhotoImage(img_temp)
label_image1.config(image=img)
label_image1.image = img
def equalize():
if path_ == '':
return
image = BmpData(path_)
# img = Image.fromarray(image.img_np.astype(np.uint8))
# img.show()
equalized_img, hist, equalized_hist = image.equalize(8) # 分别为均衡化的图/直方图/均衡化后的直方图
equalized_img = Image.fromarray(equalized_img.astype(np.uint8))
# equalized_img.show()
name_parts = path_.split('.')
name_parts[-2] += "_equalized"
new_file_name = '.'.join(name_parts)
image.save_equalized_img(new_file_name)
equalized_img = equalized_img.resize((int(256 * 0.8), int(256 * 0.8)))
equalized_img = ImageTk.PhotoImage(equalized_img)
label_image2.config(image=equalized_img)
label_image2.image = equalized_img # 处理后的图片的显示
def medianfilter():
if path_ == '':
return
image = BmpData(path_)
medianfiltered_img = image.medianfilter()
medianfiltered_img = Image.fromarray(medianfiltered_img.astype(np.uint8))
# medianfiltered_img.show()
name_parts = path_.split('.')
name_parts[-2] += "_medianfiltered"
new_file_name = '.'.join(name_parts)
image.save_medianfiltered_img(new_file_name)
medianfiltered_img = medianfiltered_img.resize((int(256 * 0.8), int(256 * 0.8)))
medianfiltered_img = ImageTk.PhotoImage(medianfiltered_img)
label_image2.config(image=medianfiltered_img)
label_image2.image = medianfiltered_img # 处理后的图片的显示
def meanfilter():
if path_ == '':
return
image = BmpData(path_)
meanfiltered_img = image.meanfilter()
meanfiltered_img = Image.fromarray(meanfiltered_img.astype(np.uint8))
# meanfiltered_img.show()
name_parts = path_.split('.')
name_parts[-2] += "_meanfiltered"
new_file_name = '.'.join(name_parts)
image.save_meanfiltered_img(new_file_name)
meanfiltered_img = meanfiltered_img.resize((int(256 * 0.8), int(256 * 0.8)))
meanfiltered_img = ImageTk.PhotoImage(meanfiltered_img)
label_image2.config(image=meanfiltered_img)
label_image2.image = meanfiltered_img # 处理后的图片的显示
if __name__ == "__main__":
root = tkinter.Tk()
root.title('21281280柯劲帆') # 标题
width, height = 600, 400
width_max, height_max = root.maxsize()
s_center = '%dx%d+%d+%d' % (width, height, (width_max - width) / 2, (height_max - height) / 2) # 将页面显示在正中间
root.geometry(s_center)
root.resizable(width=False, height=False) # 窗口不可移动
l = tkinter.Label(root, text='实验三', width=60, height=2, fg='black', font=("微软雅黑", 16), anchor=tkinter.CENTER)
l.pack()
label_image1 = tkinter.Label(root, width=int(256 * 0.8), height=int(256 * 0.8), bg='whitesmoke', anchor=tkinter.NE)
label_image1.pack()
label_image1.place(x=45, y=70, width=int(256 * 0.8), height=int(256 * 0.8))
label_image2 = tkinter.Label(root, width=int(256 * 0.8), height=int(256 * 0.8), bg='whitesmoke', anchor=tkinter.NE)
label_image2.place(x=350, y=70, width=int(256 * 0.8), height=int(256 * 0.8))
# 文本按钮
Image_Input = tkinter.Button(root, text='Choose', command=choosepic)
Image_Input.place(x=50, y=300, width=90, height=30)
# 直方图均衡化
Fun1 = tkinter.Button(root, text='直方图均衡化', command=equalize)
Fun1.place(x=150, y=300, width=90, height=30)
# 中值滤波
Fun1 = tkinter.Button(root, text='中值滤波', command=medianfilter) # 添加对应按钮
Fun1.place(x=250, y=300, width=90, height=30)
# 均值滤波
Fun2 = tkinter.Button(root, text='均值滤波', command=meanfilter) # 添加对应按钮
Fun2.place(x=350, y=300, width=90, height=30)
# 退出
Quit = tkinter.Button(root, text='Quit', command=sys.exit)
Quit.place(x=450, y=300, width=90, height=30)
end = tkinter.Label(root, text='21281280 柯劲帆', fg='silver', font=("微软雅黑", 10))
end.place(x=215, y=360, width=200, height=20)
root.mainloop()