DICOM文件可以大致分为两部分:
一部分:与图像相关的元信息,包括患者信息,检查信息,序列信息,图像信息等等。
另一部分:图像的像素数据。
在解析DICOM文件中的像素数据的时候,我们先需要读取以下图像相关信息:
以下是某个CT影像中的图像信息示例:
(0028,0002) Samples per Pixel VR: US Length: 2 Value: 1
(0028,0004) Photometric Interpretation VR: CS Length: 12 Value: MONOCHROME2
(0028,0010) Rows VR: US Length: 2 Value: 512
(0028,0011) Columns VR: US Length: 2 Value: 512
(0028,0030) Pixel Spacing VR: DS Length: 22 Value: 0.48828125\0.48828125
(0028,0100) Bits Allocated VR: US Length: 2 Value: 16
(0028,0101) Bits Stored VR: US Length: 2 Value: 12
(0028,0102) High Bit VR: US Length: 2 Value: 11
(0028,0103) Pixel Representation VR: US Length: 2 Value: 0
(0028,1050) Window Center VR: DS Length: 12 Value: 00100\00100
(0028,1051) Window Width VR: DS Length: 12 Value: 00500\00500
(0028,1052) Rescale Intercept VR: DS Length: 6 Value: -1000
(0028,1053) Rescale Slope VR: DS Length: 2 Value: 1
(0028,2110) Lossy Image Compression VR: CS Length: 2 Value: 01
(0028,2112) Lossy Image Compression Ratio VR: DS Length: 8 Value: 6.228918
1.(0028,0002) Samples per Pixel
每一个像素的取样数,一般来说,CT,MR,DR等灰度图像都是1,而彩超等彩**图像都是3,分别表示R, G, B三个颜色通道。
2.(0028,0004) Photometric Interpretation
我们经常碰到的Photometric Interpretation有以下几种类型:
Monochrome2 一般的灰度图像都采用这种,Pixel值越大,图像就越白。
Monochrome1 只有部分CR, DR图像使用,Pixel值越大,图像就越黑。
Palette Colour 一般用于彩超图像,每个像素占用8位或者16位,调色板保存在[0028,1201]RedPaletteColorLookupTableData, [0028,1202]GreenPaletteColorLookupTableData, [0028,1203]BluePaletteColorLookupTableData的属性中。
RGB 这是最常用的彩**图像格式。
YBR_FULL 另外一种彩**图像格式, 存储格式为Y(Luminance 亮度), B(Blueness 蓝色), R(Redness, 红色)
YBR_FULL_422 一般用于JPG有损压缩格式的彩**图像,每两个像素共同使用32位,每一个像素都有自己的Y(Luminance 亮度),但是共享相同的B(Blueness 蓝色), R(Redness, 红色)。所以,它的像素值存储方式是:YYBR,YYBT,YYBR
YBR_RCT 用于JPEG 2000无损压缩彩*图像,Reversible Color Transformation, 可逆色彩变换。
Y = (R+2G+B)/4, CB = B-G , CR = R - G
G = Y - (CR+CB)/4 , R = CR + G, B = CB + G
YBR_ICT 用于JPEG 2000有损压缩彩**图像 Irreversible Color Transformation, 不可逆色彩变换。
Y = + .29900R + .58700G + .11400B
CB = - .16875R - .33126G + .50000B
CR = + .50000R - .41869G - .08131B
(0028,0010)Rows
图像的高度(0028,0011)Columns
图像的宽度(0028,0030)Pixel Spacing
图像像素间距,读取Pixel Data的时候不需要,主要用于长度测量。(0028,0100)Bits Allocated
一个像素取样点存储时分配到的位数,一般RGB的图像,每一个颜色通道都使用8位,所以一般取值为8。对于灰度图像,如果是256级灰阶,一般就是8位。如果高于256级灰阶,一般就采用16位。(0028,0101)Bits Stored
一个像素取样点存储时使用到的位数。比方说示例中CT影像,采用的是4K灰阶,像素值取值范围为0~4095,所以使用到的位数为12位。(0028,0102)High Bit
最高位序号,它定义了存储点在分配的内存中的排列方式,它的值是最后一个bit的序号。如果第一个bit放在0位,那么最后一个bit为Bits Stored -1。(0028,0103)Pixel Representation
如果这个值为0, 这表明是无符号类型,其VR类型应该为US,Unsigned Short. 如果这个值为1, 这表明为有符号类型,其VR类型应该为SS,Signed Short.(0028,1050)Window Center 和 (0028,1051) Window Width
窗宽窗位,不解释(0028,1052)Rescale Intercept 和 (0028,1053)Rescale Slope
用于根据像素值计算原始值,比方说,CT可以用于计算HU值。
比方说:HU = Rescale Slope * X + Rescale Intercept.(0028,2110)Lossy Image Compression
当该值为1时,表明该图像曾经经过有损压缩处理。即使后来解压缩后,再用非压缩格式存储和传输,该值也需要保持为1.(0028,2112)Lossy Image Compression Ratio
有损压缩压缩率。
对于多帧图像,我们还需要读取Number of Frames (0028,0008)来获取帧数,然后,逐帧读取Pixel Data。
对于彩*图像,我们还需要读取Planar configuration (0028,0006),它定义了各个彩色通道值在Pixel Data中排列的排列方式。
当此值为0的时候,它这样排列的RGBRGBRGBRGBRGB。
当此值为1的时候,它是这样排列的:RRRRR……GGGGG…….BBBBB。 对于多帧图像,它是这样排列的:第一帧的RRR..,第一帧的GGG…,第一帧的BBB…,第二帧的RRR..,第二帧的GGG…,第二帧的BBB…