[科普]关于文件头的那些事

一个文件里面的内容到底是啥?用惯了Windows的人肯定是看后缀。但是后缀这个东西说改就改,不可靠。所以,最保险的还是把文件类型信息写到文件里面,通常来说,也就是写到文件开头的那几个字节。这是最方便,最快捷的用来辨别一个文件真实内容的方法。下面举几个例子:
  • Java class文件的魔数
每一个Java Class文件都是以0x CAFEBABE开头的。Java这么做的原因就是为了快速判断一个文件是不是有可能为class文件,以及这个class文件有没有受损(文件受损,文件开头受损的可能性最大)。
为什么是CAFEBABE呢?这个只能猜了,首先,16进制里面的字母只有A到F,十分的有限。Java一直以咖啡为代言,CAFEBABE可以认为是 Cafe Babe,读音上和Cafe Baby很近。所以这个也许就是代表Cafe Baby的意思。

  • 文本文件的BOM
比如说,对于文本文件,开头的几个字节可以叫做BOM(Byte Order Mark),它的作用是用来标记文本文件内部是用的哪种Unicode编码,以及其字节码顺序。UTF-8,UTF-16BE,UTF-16LE等等各种Unicode编码都有自己独一无二的BOM。一般的文本编辑器也都支持 BOM。这样就不会出现乱码了。

  • Zip文件的P.K.
所有的zip文件,都是以PK这两个字母开头的。所以,无论怎么去修改zip文件的后缀,解压程序都可以简单的判断一个文件是不是有可能为zip文件。
不信可以用二进制文本编辑器打开看看,比如notepad++:

PK代表的不是游戏里的Person Kill,而是zip算法(PKZIP算法)的发明者菲尔·卡茨(Phil Katz)名字首字母的缩写。
Phil Katz 在当时也算是个大牛级人物,不想为了一个压缩软件付钱就一跺脚自己写了一个更好的压缩算法,而且还完全无偿开放这个标准。不过,Phil Katz成就了 zip算法,zip算法却没有拯救Phil Katz。zip没有给他带来一分钱,这位无私奉献的工程师生活不顺,死于酗酒,甚至现在连一张像样的照片都流传下来,一声叹息呀。


常用文件的文件头如下: 

 

1. MIDI (mid),文件头:4D546864  

2.  JPEG (jpg),文件头:FFD8FF   

3.  PNG (png),文件头:89504E47   

4.  GIF (gif),文件头:47494638   

5.  TIFF (tif),文件头:49492A00   

6.  Windows Bitmap (bmp),文件头:424D   

7.  CAD (dwg),文件头:41433130   

8.  Adobe Photoshop (psd),文件头:38425053   

9.  Rich Text Format (rtf),文件头:7B5C727466   

10. XML (xml),文件头:3C3F786D6C   

11. HTML (html),文件头:68746D6C3E   

12. Email [thorough only] (eml),文件头:44656C69766572792D646174653A   

13. Outlook Express (dbx),文件头:CFAD12FEC5FD746F    

14. Outlook (pst),文件头:2142444E   

15. MS Word/Excel (xls.or.doc),文件头:D0CF11E0   

16. MS Access (mdb),文件头:5374616E64617264204A   

17. WordPerfect (wpd),文件头:FF575043   

18. Postscript (eps.or.ps),文件头:252150532D41646F6265   

19. Adobe Acrobat (pdf),文件头:255044462D312E   

20. Quicken (qdf),文件头:AC9EBD8F   

21. Windows Password (pwl),文件头:E3828596   

22. ZIP Archive (zip),文件头:504B0304   

23. RAR Archive (rar),文件头:52617221   

24. Wave (wav),文件头:57415645   

25. AVI (avi),文件头:52494646

26. Real Audio (ram),文件头:2E7261FD   

27. Real Media (rm),文件头:2E524D46   

28. Windows Media Audio(wma)(asf),文件头:3026b2758e66cf

29. wrf, 文件头:574f5446000600

29. MPEG (mpg),文件头:000001BA   

30. MPEG (mpg),文件头:000001B3   

31. Quicktime (mov),文件头:6D6F6F76   

32. Windows Media (asf),文件头:3026B2758E66CF11   

 

写一个代码测试一下:

[java]  view plain  copy
  1. public static String bytesToHexString(byte[] src) {    
  2.        StringBuilder stringBuilder = new StringBuilder();    
  3.        if (src == null || src.length <= 0) {    
  4.            return null;    
  5.        }    
  6.        for (int i = 0; i < src.length; i++) {    
  7.            int v = src[i] & 0xFF;    
  8.            String hv = Integer.toHexString(v);    
  9.            if (hv.length() < 2) {    
  10.                stringBuilder.append(0);    
  11.            }    
  12.            stringBuilder.append(hv);    
  13.        }    
  14.        return stringBuilder.toString();    
  15.    }    
  16.    
  17.    public static void main(String[] args) throws Exception {    
  18.        FileInputStream is = new FileInputStream("E:\\学习\\Java面试宝典2014版.pdf");    
  19.        byte[] b = new byte[7];    
  20.        is.read(b, 0, b.length);    
  21.        System.out.println(bytesToHexString(b));    
  22.    
  23.    }    

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
FAT12(File Allocation Table 12)是一种用于存储文件系统的格式,常用于早期的操作系统和可移动存储介质(如软盘)。下面是一些关于FAT12文件格式的科普: 1. 文件系统结构:FAT12文件系统由引导扇区(boot sector)、FAT表(File Allocation Table)、根目录区(root directory area)和数据区(data area)组成。 2. 引导扇区:FAT12文件系统的第一个扇区称为引导扇区,它包含了引导加载程序和文件系统的基本信息。引导加载程序负责在计算机启动时加载操作系统。 3. FAT表:FAT表是FAT12文件系统的核心部分,它记录了存储介质上每个簇(cluster)的使用情况。簇是文件系统中的最小存储单位,通常为512字节。 4. 根目录区:根目录区保存了存储介质的根目录,其中包含了文件和子目录的信息。在FAT12中,根目录区占用固定的扇区数。 5. 数据区:数据区是存储介质上用于存放文件和目录内容的部分。它由一系列簇组成,每个簇都在FAT表中有相应的记录。 6. 文件和目录:FAT12文件系统使用8.3文件名格式,即文件名最多可以包含8个字符,后跟一个句点(.),再加上文件扩展名,扩展名最多可以包含3个字符。 7. 文件分配:FAT12使用FAT表来跟踪文件的簇分配情况。每个簇的状态(如已分配、空闲、损坏等)都记录在FAT表中的相应项中。 8. 文件访问:FAT12文件系统使用文件的起始簇号来定位文件的存储位置。通过遍历FAT表中的项,可以找到文件的下一个簇,并持续跟踪直到文件结束。 需要注意的是,FAT12是一种相对简单的文件系统格式,它有一些局限性,例如文件名长度限制和最大存储容量限制等。随着技术的发展,更先进的文件系统如FAT16、FAT32和NTFS已经取代了FAT12,在现代操作系统中得到广泛使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xosg

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值