java 文件头 文件类型 files_根据文件头数据判断文件类型

现有一文件,其扩展名未知或标记错误。假设它是一个正常的、非空的文件,且将扩展名更正后可以正常使用,那么,如何判断它是哪种类型的文件?

在后缀未知,或者后缀被修改的文件,依然通过文件头来判断该文件究竟是什么文件类型。我们可以使用一个文本编辑工具如UltraEdit打开文件(16进制模式下),然后看文件头是什么字符,以下是常见文件类型的文件头字符(16进制),希望对你有帮助:

JPEG (jpg),文件头:FFD8FF

PNG (png),文件头:89504E47

GIF (gif),文件头:47494638

TIFF (tif),文件头:49492A00

Windows Bitmap (bmp),文件头:424D

CAD (dwg),文件头:41433130

Adobe Photoshop (psd),文件头:38425053

Rich Text Format (rtf),文件头:7B5C727466

XML (xml),文件头:3C3F786D6C

HTML (html),文件头:68746D6C3E

Email [thorough only] (eml),文件头:44656C69766572792D646174653A

Outlook Express (dbx),文件头:CFAD12FEC5FD746F

Outlook (pst),文件头:2142444E

MS Word/Excel (xls.or.doc),文件头:D0CF11E0

MS Access (mdb),文件头:5374616E64617264204A

WordPerfect (wpd),文件头:FF575043

Postscript (eps.or.ps),文件头:252150532D41646F6265

Adobe Acrobat (pdf),文件头:255044462D312E

Quicken (qdf),文件头:AC9EBD8F

Windows Password (pwl),文件头:E3828596

ZIP Archive (zip),文件头:504B0304

RAR Archive (rar),文件头:52617221

Wave (wav),文件头:57415645

AVI (avi),文件头:41564920

Real Audio (ram),文件头:2E7261FD

Real Media (rm),文件头:2E524D46

MPEG (mpg),文件头:000001BA

MPEG (mpg),文件头:000001B3

Quicktime (mov),文件头:6D6F6F76

Windows Media (asf),文件头:3026B2758E66CF11

MIDI (mid),文件头:4D546864

下面在提供一个网上使用java写的根据头文件码判断文件类型

packagecom;importjava.io.FileInputStream;importjava.io.FileNotFoundException;importjava.io.IOException;importjava.util.Date;importjava.util.HashMap;importjava.util.Iterator;importjava.util.Map;importjava.util.Set;public classFileType {public final static Map FILE_TYPE_MAP = new HashMap();privateFileType(){}static{

getAllFileType();//初始化文件类型信息

}/*** Discription:[getAllFileType,常见文件头信息]*/

private static voidgetAllFileType()

{

FILE_TYPE_MAP.put("ffd8ffe000104a464946", "jpg"); //JPEG (jpg)

FILE_TYPE_MAP.put("89504e470d0a1a0a0000", "png"); //PNG (png)

FILE_TYPE_MAP.put("47494638396126026f01", "gif"); //GIF (gif)

FILE_TYPE_MAP.put("49492a00227105008037", "tif"); //TIFF (tif)

FILE_TYPE_MAP.put("424d228c010000000000", "bmp"); //16色位图(bmp)

FILE_TYPE_MAP.put("424d8240090000000000", "bmp"); //24位位图(bmp)

FILE_TYPE_MAP.put("424d8e1b030000000000", "bmp"); //256色位图(bmp)

FILE_TYPE_MAP.put("41433130313500000000", "dwg"); //CAD (dwg)

FILE_TYPE_MAP.put("3c21444f435459504520", "html"); //HTML (html)

FILE_TYPE_MAP.put("3c21646f637479706520", "htm"); //HTM (htm)

FILE_TYPE_MAP.put("48544d4c207b0d0a0942", "css"); //css

FILE_TYPE_MAP.put("696b2e71623d696b2e71", "js"); //js

FILE_TYPE_MAP.put("7b5c727466315c616e73", "rtf"); //Rich Text Format (rtf)

FILE_TYPE_MAP.put("38425053000100000000", "psd"); //Photoshop (psd)

FILE_TYPE_MAP.put("46726f6d3a203d3f6762", "eml"); //Email [Outlook Express 6] (eml)

FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "doc"); //MS Excel 注意:word、msi 和 excel的文件头一样

FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "vsd"); //Visio 绘图

FILE_TYPE_MAP.put("5374616E64617264204A", "mdb"); //MS Access (mdb)

FILE_TYPE_MAP.put("252150532D41646F6265", "ps");

FILE_TYPE_MAP.put("255044462d312e350d0a", "pdf"); //Adobe Acrobat (pdf)

FILE_TYPE_MAP.put("2e524d46000000120001", "rmvb"); //rmvb/rm相同

FILE_TYPE_MAP.put("464c5601050000000900", "flv"); //flv与f4v相同

FILE_TYPE_MAP.put("00000020667479706d70", "mp4");

FILE_TYPE_MAP.put("49443303000000002176", "mp3");

FILE_TYPE_MAP.put("000001ba210001000180", "mpg"); //

FILE_TYPE_MAP.put("3026b2758e66cf11a6d9", "wmv"); //wmv与asf相同

FILE_TYPE_MAP.put("52494646e27807005741", "wav"); //Wave (wav)

FILE_TYPE_MAP.put("52494646d07d60074156", "avi");

FILE_TYPE_MAP.put("4d546864000000060001", "mid"); //MIDI (mid)

FILE_TYPE_MAP.put("504b0304140000000800", "zip");

FILE_TYPE_MAP.put("526172211a0700cf9073", "rar");

FILE_TYPE_MAP.put("235468697320636f6e66", "ini");

FILE_TYPE_MAP.put("504b03040a0000000000", "jar");

FILE_TYPE_MAP.put("4d5a9000030000000400", "exe");//可执行文件

FILE_TYPE_MAP.put("3c25402070616765206c", "jsp");//jsp文件

FILE_TYPE_MAP.put("4d616e69666573742d56", "mf");//MF文件

FILE_TYPE_MAP.put("3c3f786d6c2076657273", "xml");//xml文件

FILE_TYPE_MAP.put("494e5345525420494e54", "sql");//xml文件

FILE_TYPE_MAP.put("7061636b616765207765", "java");//java文件

FILE_TYPE_MAP.put("406563686f206f66660d", "bat");//bat文件

FILE_TYPE_MAP.put("1f8b0800000000000000", "gz");//gz文件

FILE_TYPE_MAP.put("6c6f67346a2e726f6f74", "properties");//bat文件

FILE_TYPE_MAP.put("cafebabe0000002e0041", "class");//bat文件

FILE_TYPE_MAP.put("49545346030000006000", "chm");//bat文件

FILE_TYPE_MAP.put("04000000010000001300", "mxp");//bat文件

FILE_TYPE_MAP.put("504b0304140006000800", "docx");//docx文件

FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "wps");//WPS文字wps、表格et、演示dps都是一样的

FILE_TYPE_MAP.put("6431303a637265617465", "torrent");

FILE_TYPE_MAP.put("6D6F6F76", "mov"); //Quicktime (mov)

FILE_TYPE_MAP.put("FF575043", "wpd"); //WordPerfect (wpd)

FILE_TYPE_MAP.put("CFAD12FEC5FD746F", "dbx"); //Outlook Express (dbx)

FILE_TYPE_MAP.put("2142444E", "pst"); //Outlook (pst)

FILE_TYPE_MAP.put("AC9EBD8F", "qdf"); //Quicken (qdf)

FILE_TYPE_MAP.put("E3828596", "pwl"); //Windows Password (pwl)

FILE_TYPE_MAP.put("2E7261FD", "ram"); //Real Audio (ram)

}/*** 得到上传文件的文件头

*@paramsrc

*@return

*/

public static String bytesToHexString(byte[] src) {

StringBuilder stringBuilder= newStringBuilder();if (src == null || src.length <= 0) {return null;

}for (int i = 0; i < src.length; i++) {int v = src[i] & 0xFF;

String hv=Integer.toHexString(v);if (hv.length() < 2) {

stringBuilder.append(0);

}

stringBuilder.append(hv);

}returnstringBuilder.toString();

}/*** 根据制定文件的文件头判断其文件类型

*@paramfilePaht

*@return

*/

public staticString getFileType(String filePaht){

String res= null;try{

FileInputStream is= newFileInputStream(filePaht);byte[] b = new byte[10];

is.read(b,0, b.length);

String fileCode=bytesToHexString(b);

System.out.println(fileCode);//这种方法在字典的头代码不够位数的时候可以用但是速度相对慢一点

Iterator keyIter =FILE_TYPE_MAP.keySet().iterator();while(keyIter.hasNext()){

String key=keyIter.next();if(key.toLowerCase().startsWith(fileCode.toLowerCase()) ||fileCode.toLowerCase().startsWith(key.toLowerCase())){

res=FILE_TYPE_MAP.get(key);break;

}

}

}catch(FileNotFoundException e) {

e.printStackTrace();

}catch(IOException e) {

e.printStackTrace();

}returnres;

}public static void main(String[] args) throwsException {

String type= getFileType("C:/test/eee.WMV");

System.out.println("eee.WMV : "+type);

System.out.println();

type= getFileType("C:/test/350996.wav");

System.out.println("350996.wav : "+type);

System.out.println();

}

}

出处:http://blog.csdn.net/songylwq/article/details/6139753

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值