Mark # RGB转灰度

图像灰度化的三种常见方法源码

方法一:
对于彩色转灰度,有一个很著名的心理学公式:

Gray = R*0.299 + G*0.587 + B*0.114

方法二:
而实际应用时,希望避免低速的浮点运算,所以需要整数算法。

注意到系数都是3位精度的没有,我们可以将它们缩放1000倍来实现整数运算算法:

Gray = (R*299 + G*587 + B*114 + 500) / 1000

RGB一般是8位精度,现在缩放1000倍,所以上面的运算是32位整型的运算。注意后面那个除法是整数 除法,所以需要加上500来实现四舍五入。
就是由于该算法需要32位运算,所以该公式的另一个变种很流行:

                      Gray = (R*30 + G*59 + B*11 + 50) / 100

方法三:

上面的整数算法已经很快了,但是有一点仍制约速度,就是最后的那个除法。移位比除法快多了,所以可以将系数缩放成 2的整数幂。

习惯上使用16位精度,2的16次幂是65536,所以这样计算系数:

                      0.299 * 65536 = 19595.264 ≈ 19595

                      0.587 * 65536 + (0.264) = 38469.632 + 0.264 = 38469.896 ≈ 38469

                      0.114 * 65536 + (0.896) =   7471.104 + 0.896 = 7472

可能很多人看见了,我所使用的舍入方式不是四舍五入。四舍五入会有较大的误差,应该将以前的计算结果的误差一起计算进去,舍入方式是去尾法:

写成表达式是:

                      Gray = (R*19595 + G*38469 + B*7472) >> 16

2至20位精度的系数:

                      Gray = (R*1 + G*2 + B*1) >> 2

                      Gray = (R*2 + G*5 + B*1) >> 3

                      Gray = (R*4 + G*10 + B*2) >> 4

                      Gray = (R*9 + G*19 + B*4) >> 5

                      Gray = (R*19 + G*37 + B*8) >> 6

                      Gray = (R*38 + G*75 + B*15) >> 7

                      Gray = (R*76 + G*150 + B*30) >> 8

                      Gray = (R*153 + G*300 + B*59) >> 9

                      Gray = (R*306 + G*601 + B*117) >> 10

                      Gray = (R*612 + G*1202 + B*234) >> 11

                      Gray = (R*1224 + G*2405 + B*467) >> 12

                      Gray = (R*2449 + G*4809 + B*934) >> 13

                      Gray = (R*4898 + G*9618 + B*1868) >> 14

                      Gray = (R*9797 + G*19235 + B*3736) >> 15

                      Gray = (R*19595 + G*38469 + B*7472) >> 16

                      Gray = (R*39190 + G*76939 + B*14943) >> 17

                      Gray = (R*78381 + G*153878 + B*29885) >> 18

                      Gray = (R*156762 + G*307757 + B*59769) >> 19

                      Gray = (R*313524 + G*615514 + B*119538) >> 20

仔细观察上面的表格,这些精度实际上是一样的:3与4、7与8、10与11、13与14、19与20

所以16位运算下最好的计算公式是使用7位精度,比先前那个系数缩放100倍的精度高,而且速度快:

                      Gray = (R*38 + G*75 + B*15) >> 7

其实最有意思的还是那个2位精度的,完全可以移位优化:

                      Gray = (R + (WORD)G<<1 + B) >> 2

MATLAB代码实现:
平均值法
最大值法
加权平均值法

	function f=MyGrayProcessing(Img)
    	[m,n,a]=size(Img);
     	Img1_Gray=zeros(m,n);
    	Img2_Gray=zeros(m,n);
    	Img3_Gray=zeros(m,n);
     	GrayImage=rgb2gray(Img);%调用MATLAB内置函数灰度化
    	for x=1:m
           for y=1:n
        	%平均值法
             	Img1_Gray(x,y)=(Img(x,y,1)+Img(x,y,2)+Img(x,y,3))/3;
             	 %最大值法 
             	Img2_Gray(x,y)=max(Img(x,y,1),max(Img(x,y,2),Img(x,y,3)));
             	%加权平均值法 
            	Img3_Gray(x,y)=0.3*Img(x,y,1)+0.59*Img(x,y,2)+0.11*Img(x,y,3);
           end
    	end
     	figure(0);
     	imshow(Img);
     	title('原图像');
     	figure(1);
     	imshow(GrayImage);
     	title('调用系统函数灰度化');
     	figure(2);
     	imshow(uint8(Img1_Gray));
     	title('平均值法灰度化图像');
     	figure(3);
     	imshow(uint8(Img2_Gray));
     	title('最大值法灰度化图像');
   	f=uint8(Img3_Gray);
   	figure(4);
   	imshow(f);
   	title('加权平均值法灰度化图像');

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
import torch import torchvision.transforms as transforms import numpy as np from skimage.segmentation import slic from skimage.segmentation import mark_boundaries from skimage.filters import sobel from skimage.color import rgb2gray from PIL import Image # 超像素数量 num_segments = 100 # 加载图像 image = Image.open('test.jpg') # 换为 PyTorch 张量 transform = transforms.ToTensor() img_tensor = transform(image).unsqueeze(0) # 换为 Numpy 数组 img_np = img_tensor.numpy().transpose(0, 2, 3, 1)[0] # 换为灰度图像 gray_img = rgb2gray(img_np) # 使用 SLIC 超像素分割算法 segments = slic(img_np, n_segments=num_segments, compactness=10, sigma=1) # 绘制超像素边界线 edge_img = mark_boundaries(img_np, segments) # 换为灰度图像 gray_edge_img = rgb2gray(edge_img) # 使用 Canny 边缘检测算法 edges = sobel(gray_edge_img) edge_map = edges > np.mean(edges) # 绘制超像素范围的线 line_map = np.zeros_like(gray_img) for i in range(num_segments): line_map[segments == i] = edge_map[segments == i].max() # 将线绘制到图像上 line_img = np.zeros_like(img_np) line_img[:, :, 0] = line_map line_img[:, :, 1] = line_map line_img[:, :, 2] = line_map result_img = img_np * (1 - line_img) + line_img * np.array([1, 0, 0]) # 显示结果 result_img = (result_img * 255).astype(np.uint8) result_img = Image.fromarray(result_img) result_img.show()上述代码出现问题:alueError: zero-size array to reduction operation maximum which has no identity
06-07
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值