dicom文件详细解析

dicom文件解析
Dicom全称是医学数字图像与通讯,这里讲diocm格式文件的解读,读取本身是没啥难度的 无非就是字节码数据流处理。只不过确实比较繁琐。
dicom中文协议文档:http://download.csdn.net/download/wenzhi20102321/9897014
dicom文件结构:


整体结构先是128字节所谓的导言部分,跳过就是了,接着就是四个字节组成的字符串,然后是dataElement元素依次排列的方式, 就是一个dataElement接一个dataElement的方式排到文件结尾.我们要读取dicom里面的各种数据就是在各个数据元素中。通俗的讲dataElement就是指tag,就是破Dicom标准里定义的数据字典,每个dataElement中的tag决定自身或整个文件的某些数据类型或自身dataElement内容类别。
其中tag和VR是要重点理解,也是比较难理解的!

一.标记tag(2字节UInt16分组号和2字节UInt16元素号);
tag是4个字节表示的 前两字节是组号后两字节是元素号 比如0008(组号) 0018(元素号)。
我们获取dicom里面的数据,就是根据tag,来知道这个dataElement里面是否是我们需要的数据,然后读取该dataElement里面的数据。

一般我们获取dataElement中的数据的主要组号
0002组描述设备通讯,0008组描述特征参数,0010组描述患者信息,0028组描述图像信息参数
还是有很多其他组号的,但是里面的数据不常用到,tag总共大约有2000个,但是我们常用的数据就那么几个!

dicom文件数据中所有dataElement从前到后按tag又可简单分段:文件元tag,普通tag,像素tag。
1.文件元tag(组号+0000):不受传输语法影响,总是以显示VR方式表示,因为它里面就定义了传输语法;文件元tag的dataElement,并没有多大的意义,它的VF数值是整个组所有dataElement的字节长度,一个dicom中可以只有一个文件元tag,也可以有多个文件元tag。
2.普通tag:除了文件元tag和像素tag,其余的都是普tag数据。包括:图像宽,高,数据传输格式,病人姓名,病人生日,病历医院,病历科室,病情的描述等等数据;
3.像素tag(7fe0,0010):表示dataElement存储的是病历的图像数据。
上面这段话,信息量其实是很多的,比如什么是显示VR、隐式VR,传输语法又是怎么回事?VR请往下看,传输语法一两句话是说不清楚的!

tag的dataElement结构,分为下面三种:
1.显示VR:VR为OB OW OF UT SQ UN的元素结构
组号    元素号    VR    预留    值长度    数据元素值
2    2    2    2(0x00,0x00)    4    由数据长度决定
组号和元素号组成tag,上面的数组表示给类型占有的字节长度

2.显示VR:VR为普通类型时元素结构(少了预留那一行)
组号    元素号    VR    值长度    数据元素值
2    2    2    4    由数据长度决定
3.隐式VR时元素结构(也就是dataElement中没有VR这个值)
组号    元素号    值长度    数据元素值
2    2    4    由数据长度决定
上面三个表格是从网上获取来的,我在dicom协议中没有看到具体的介绍,也不知怎么验证正确性!
暂时先按照上面的理解,有问题再去思考吧。

dicom文件的所有传输语法(区分显式/隐式VR,litter字节/bie字节):
最关键的两个tag:
1.tag:0002,0010,决定普通tag的读取方式 little字节序还是big字节序,隐式VR还是显示VR。由它的值决定
2.tag:7fe0,0010,像素数据开始处
dicom文件的tag详解:
http://blog.csdn.net/wenzhi20102321/article/details/75127101

使用工具snate DICOM打开dicom文件,查看数据效果:

工具下载地址,下载后直接用:http://download.csdn.net/download/wenzhi20102321/9895616
上面图片每一行数据就是一个dataElement数据,可以看到tag值,VR值,VL值,VF值。
但是一般工具也是看不到图像的tag数据,因为他的VF数据有几万个字节,怎么显示!

二.值表示法VR- Value Representation(2个单字节Char);
怎么理解VR呢,VR其实就是表示一种类别,表示的是该dataELement的类别。
VR,类似于java的String,Long,VR有LO(LongString长字符串),IS(IntergerString整形字符串),DA(data日期)等等共27中类型。

dicom的VR类型详解:
http://blog.csdn.net/wenzhi20102321/article/details/75127140

数据内容的存储与表现格式与VR是关联的,但比较恶心的是,VR不是一定存在,也就是可能有隐式的情况(需要根据元素标识进行判断),此外VR的属性还可能是UN(Unknown)等等等等。当然除非你要自己写解析,否则了解到这就可以了。dicom文件中的全体数据必须具有相同的数据结构。

VR和Tag还是很有关联的。
我们知道tag是有很多的,大概2000个,也就是说有2000种tag。
但是VR只有27种。
每一种Tag其实是有一个固定的VR类型,也就是说不同的dicom文件他的同一个tag,VR肯定也是相同的。
但是,不同的tag可能对应同一个VR类型。这就类是于java中的姓名和身份证号码都是String类型的。

三.长度VL-Value Length(2字节UInt16,有些情况是4字节UInt32)
数据长度:所有DICOM数据元素都应该为偶数长度,若为奇数,追加空格或空NULL
得到这个VL的数值大小就知道这个dataElement的字节长度。

四.值VF-Value Field(如果VL=0xFFFFFFFF,则需要一直读到截止符)。
值是整个dataElement里面数据的表现形式,如:用户名,年龄,性别等等数据,当然,图像字节的数据也在对应的VF里面,但是表现不出来。

整理
根据以上的分析相信解析一个dicom格式文件的过程已经很清晰了吧

第一步:
跳过128字节导言部分,并读取”DICM”4个字符 以确认是dicom格式文件

第二步:
读取第一部分 也就是非常重要的文件元dataElement 。读取tag 并根据0002,0010的值确定dataElement的VR是显式还是隐式和dataElement的传输语法。

其他
一个字节是八位,这是固定的。
机器语言都是二进制(0,1)的数据保存和读取;
一个字节byte就是有八位,比如:0001 0100
但是我们数据的读取都是读取字节byte的,比如前面说的128字节,说的就是128个byte数据
后面四个字节,就是4个byte,这四个字节是可以组成字符串“DICM”
接着就是四个字节的tag,但是这四个字节的tag不能组成字符串
上面说到一个字节是8位,前面四位范围是0000-1111,后面也一样,正好是0到15.
所以一个字节用16进制可以表示为0x00-0xff.同二进制00000000-11111111是一样的。
比如我们看到tag:0020 0010,其实是0x00200010,16进制的!
第一个字节为:0x00
第二个字节为:0x20
第三个字节为:0x00
第四个字节为:0x10
再验证下上面那句话,一个字节8位,所以用一个16进制的数值表示4位,两个16进制的数值就表示8位了!
所有tag四个字节,为啥是8个数值表示!

比如java代码,
读取到dicom的DICOM字符串和第一个:Tag值,VF值

public class ImageDemo {

    public static void main(String args[]) {

        getData("D:\\dicom\\test1.dcm");
    }

  /**
     * 读取dicom文件字节流数据看看
     */
    private static void getData(String filePath) {
        System.out.println("解析文件:" + filePath);
        File file = new File(filePath);
        try {
            FileInputStream is = new FileInputStream(file);
            //跳过128个字节
            is.read(new byte[128]);

            //读取4个字节,要把这四个字节转变成字符串才能看到“DICM”
            byte[] buf = new byte[4];
            is.read(buf);
            String msg_DCM = new String(buf);
            System.out.println("跳过128后面的四个字节,字节1:" + buf[0] + ",字节2:" + buf[1] + ",字节3:" + buf[2] + ",字节4:" + buf[3]);
            System.out.println("跳过128后面的四个字节组成的字符串:" + msg_DCM);
            System.out.println(" ");

            //获取第一个tag的四个字节
            is.read(buf);
            String msg_Tag = new String(buf);
            System.out.println("Tag的四个字节,字节1:" + buf[0] + ",字节2:" + buf[1] + ",字节3:" + buf[2] + ",字节4:" + buf[3]);
            System.out.println(" ");

            //获取第一个VR的两个字节
            byte[] buf2 = new byte[2];
            is.read(buf2);
            String msg_VR = new String(buf2);
            System.out.println("VR的两个字节,字节1:" + buf2[0] + ",字节2:" + buf2[1]);
            System.out.println("VR的两个字节组成的字符串:" + msg_VR);
            System.out.println(" ");

            //获取第一个VL的四个字节
            is.read(buf);
            String msg_VL = new String(buf);
            System.out.println("VL的四个字节,字节1:" + buf[0] + ",字节2:" + buf[1] + ",字节3:" + buf[2] + ",字节4:" + buf[3]);
            System.out.println("VL的四个字节组成的字符串:" + msg_VL);
            System.out.println(" ");

            //获取第一个VF的四个字节
            is.read(buf);
            String msg_VF = new String(buf);
            System.out.println("VF的四个字节,字节1:" + buf[0] + ",字节2:" + buf[1] + ",字节3:" + buf[2] + ",字节4:" + buf[3]);
            System.out.println("VF的四个字节组成的字符串:" + msg_VL);
            System.out.println(" ");

        } catch (Exception e) {
            e.printStackTrace();
        }
    }

}

程序运行后效果:

上面图片标记错了,第一个tag应该是:0002 0000
使用工具查看这个文件,第一个数据也是,这个tag数据:


dicom传输的相关知识也只能介绍到这里,上面很多知识还没有理解透彻,只是把这些知识罗列出来,给大家参考一下!

dicom文件解析知识的其他地址:
1.dicom文件详解
http://blog.csdn.net/wenzhi20102321/article/details/75127362

2.dicom文件的值类型VR详解
http://blog.csdn.net/wenzhi20102321/article/details/75127140

3.dicom文件tag详解
http://blog.csdn.net/wenzhi20102321/article/details/75127101

4.android 解析并显示dicom文件的数据和图像
http://blog.csdn.net/wenzhi20102321/article/details/75040225

5.java代码使用ImageJ解析dicom文件成图片
http://blog.csdn.net/wenzhi20102321/article/details/74995084

前面5个是我自己写的,后面是一些我自己看过的相关资料:

6.Dicom文件解析
http://blog.csdn.net/leaf6094189/article/details/8510325

7.使用dcm4che3获取Dicom的bmp格式缩略图
http://blog.csdn.net/Kerrigeng/article/details/60866656

8.使用dcm4che3解析DICOM中,中文乱码问题
http://blog.csdn.net/Kerrigeng/article/details/53942846

9.使用dcm4che3对jpeg压缩的dcm文件进行解压
http://blog.csdn.net/Kerrigeng/article/details/62215647

10.DICOM的常用Tag分类和说明
http://www.cnblogs.com/stephen2014/p/4579443.html

11.dicom的大牛zssure的博客,几十篇文章
http://blog.csdn.net/zssureqh/article/category/1389985

12.dicom协议中文文档下载
http://download.csdn.net/detail/wenzhi20102321/9897014

13.Sante DICOM Editor 4,查看dicom文件的工具,直接打开用
http://download.csdn.net/detail/wenzhi20102321/9895616

 

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值