DICOM图像

最新推荐文章于 2020-12-08 02:29:59 发布

*Major*

最新推荐文章于 2020-12-08 02:29:59 发布

阅读量3.3k

点赞数

本文链接：https://blog.csdn.net/qq_41375318/article/details/102835599

版权

医学影像(Medical Imaging)，是指利用某种介质（例如X射线、电磁、超声波等等）与人体相互作用，从而以影像方式将人体内部组织器官的结构和密度表现出来，然后提供给医生进行判断并对人体健康状况得出结论的一门科学。

医学影像仪器主要包含：

X光影像仪器
CT（Computerized Tomography Computed Tomography）
超声（分B超、彩色多普勒超声、心脏彩超、三维彩超）
核磁共振成像（MRI）

DICOM（医学数字成像和通讯），英文全称Digital Imaging and Communications in Medicine，是ACR（美国放射协会）和NAMA（美国国家电子制造商协会）联合开发医学数字成像和通讯的一个通用标准。

Dicom官方文档：https://www.dicomstandard.org/current/

患者的医学图像以DICOM文件格式进行存储，其中包含了图像信息以及患者的PHI（protected health information，即姓名、性别、年龄等），以及产生图像的设备的相关信息。如下图所示，以dcm后缀结尾的文件即DICOM文件，其存储的信息为二进制格式。

DICOM文件的内容一般由一个`DICOM文件头`和一个`DICOM数据集`组成

每个DICOM文件都必须包含文件头，主要信息：

文件导言
DICOM前缀
文件元信息元素

DICOM数据集是DICOM文件的主要组成部分

TAG号
值表示
值长度
值域

基于DICOM3.0标准，每一张图都携带大量的信息，可以细分为以下四类：

Patient
Study
Series
Image

每一项信息都可以用DICOM TAG来标识，DICOM TAG由两个十六进制数组成，即（Group，Element）

每一项信息被包装成最基本的单元：Data Element(数据元素)。每个Data Element 由四部分组成：

DICOM TAG ：存储该项信息的标识
VR（Value Representation）：存储描述该项信息的数据类型
value length ：存储描述该项信息的数据长度
value：存储描述该项信息的数据值

处理DICOM文件的现成库

C++：DCMTK
Java：dcm4che
Python：pydicom

安装pydicom

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pydicom

DICOM文件可以大致分为两部分：
一部分：与图像相关的元信息，包括患者信息，检查信息，序列信息，图像信息等等。
另一部分：图像的像素数据。在解析DICOM文件中的像素数据的时候，我们先需要读取以下图像相关信息：
以下是某个CT影像中的图像信息示例： (0028,0002) Samples per Pixel VR: US Length: 2 Value: 1 (0028,0004) Photometric Interpretation VR: CS Length: 12 Value: MONOCHROME2 (0028,0010) Rows VR: US Length: 2 Value: 512 (0028,0011) Columns VR: US Length: 2 Value: 512 (0028,0030) Pixel Spacing VR: DS Length: 22 Value:
0.48828125\0.48828125 (0028,0100) Bits Allocated VR: US Length: 2 Value: 16 (0028,0101) Bits Stored VR: US Length: 2 Value: 12 (0028,0102) High Bit VR: US Length: 2 Value: 11 (0028,0103) Pixel Representation VR: US Length: 2 Value: 0 (0028,1050) Window Center VR: DS Length: 12 Value: 00100\00100 (0028,1051) Window Width VR: DS Length: 12 Value: 00500\00500 (0028,1052) Rescale Intercept VR: DS Length: 6 Value: -1000 (0028,1053) Rescale Slope VR: DS Length: 2 Value: 1 (0028,2110) Lossy Image Compression VR: CS Length: 2 Value: 01 (0028,2112) Lossy Image Compression Ratio VR: DS Length: 8 Value: 6.228918

1.(0028,0002) Samples per Pixel
每一个像素的取样数，一般来说，CT，MR，DR等灰度图像都是1，而彩超等彩图像都是3，分别表示R, G, B三个颜色通道。

2.(0028,0004) Photometric Interpretation
我们经常碰到的Photometric Interpretation有以下几种类型：
Monochrome2 一般的灰度图像都采用这种，Pixel值越大，图像就越白。
Monochrome1 只有部分CR, DR图像使用，Pixel值越大，图像就越黑。
Palette Colour 一般用于彩超图像，每个像素占用8位或者16位，调色板保存在[0028,1201]RedPaletteColorLookupTableData, [0028,1202]GreenPaletteColorLookupTableData, [0028,1203]BluePaletteColorLookupTableData的属性中。
RGB 这是最常用的彩图像格式。
YBR_FULL 另外一种彩图像格式，存储格式为Ｙ(Luminance 亮度)， B(Blueness 蓝色)， R（Redness, 红色）
YBR_FULL_422 一般用于JPG有损压缩格式的彩图像，每两个像素共同使用32位，每一个像素都有自己的Ｙ(Luminance 亮度)，但是共享相同的B(Blueness 蓝色)， R（Redness, 红色）。所以，它的像素值存储方式是：YYBR,YYBT,YYBR
YBR_RCT 用于JPEG 2000无损压缩彩图*像，Reversible Color Transformation, 可逆色彩变换。
Y = (R+2G+B)/4， CB = B-G ， CR = R - G
G = Y - (CR+CB)/4 , R = CR + G, B = CB + G
YBR_ICT 用于JPEG 2000有损压缩彩**图像 Irreversible Color Transformation, 不可逆色彩变换。
Y = + .29900R + .58700G + .11400B
CB = - .16875R - .33126G + .50000B
CR = + .50000R - .41869G - .08131B
3. (0028,0010)Rows
图像的高度

(0028,0011)Columns
图像的宽度
(0028,0030)Pixel Spacing
图像像素间距，读取Pixel Data的时候不需要，主要用于长度测量。
(0028,0100)Bits Allocated
一个像素取样点存储时分配到的位数，一般RGB的图像，每一个颜色通道都使用8位，所以一般取值为8。对于灰度图像，如果是256级灰阶，一般就是8位。如果高于256级灰阶，一般就采用16位。
(0028,0101)Bits Stored
一个像素取样点存储时使用到的位数。比方说示例中CT影像，采用的是4K灰阶，像素值取值范围为0~4095，所以使用到的位数为12位。
(0028,0102)High Bit
最高位序号，它定义了存储点在分配的内存中的排列方式，它的值是最后一个bit的序号。如果第一个bit放在0位，那么最后一个bit为Bits Stored -1。
(0028,0103)Pixel Representation
如果这个值为0，这表明是无符号类型，其VR类型应该为US，Unsigned Short. 如果这个值为1，这表明为有符号类型，其VR类型应该为SS，Signed Short.
(0028,1050)Window Center 和 (0028,1051) Window Width
窗宽窗位，不解释
(0028,1052)Rescale Intercept 和 (0028,1053)Rescale Slope
用于根据像素值计算原始值，比方说，CT可以用于计算HU值。
比方说：HU = Rescale Slope * X + Rescale Intercept.
(0028,2110)Lossy Image Compression
当该值为1时，表明该图像曾经经过有损压缩处理。即使后来解压缩后，再用非压缩格式存储和传输，该值也需要保持为1.
(0028,2112)Lossy Image Compression Ratio
有损压缩压缩率。对于多帧图像，我们还需要读取Number of Frames (0028,0008)来获取帧数，然后，逐帧读取Pixel Data。对于彩*图像，我们还需要读取Planar configuration (0028,0006)，它定义了各个彩色通道值在Pixel Data中排列的排列方式。当此值为0的时候，它这样排列的RGBRGBRGBRGBRGB。当此值为1的时候，它是这样排列的：RRRRR…GGGGG…BBBBB。对于多帧图像，它是这样排列的：第一帧的RRR…，第一帧的GGG…，第一帧的BBB…,第二帧的RRR…，第二帧的GGG…，第二帧的BBB…