tableexport 文件格式和扩展名不匹配_电脑文件格式猜测

1、 了解ultraedit.exe的使用方法

2、 了解文件格式的查看

3、 判断文件的格式

文件格式

文件格式(或文件类型)是指电脑为了存储信息而使用的对信息的特殊编码方式,是用于识别内部储存的资料。比如有的储存图片,有的储存程序,有的储存文字信息。每一类信息,都可以一种或多种文件格式保存在电脑存储中。每一种文件格式通常会有一种或多种扩展名可以用来识别,但也可能没有扩展名。扩展名可以帮助应用程序识别的文件格式。

文件格式定义

对于硬盘机或任何电脑存储来说,有效的信息只有0和1两种。所以电脑必须设计有相应的方式进行信息-位元的转换。对于不同的信息有不同的存储格式。

概述

有些文件格式被设计用于存储特殊的数据,例如:图像文件中的JPEG文件格式仅用于存储静态的图像,而GIF既可以存储静态图像,也可以存储简单动画;Quicktime 格式则可以存储多种不同的媒体类型。文本类的文件有:text文件一般仅存储简单没有格式的ASCII或Unicode的文本;HTML文件则可以存储带有格式的文本;PDF格式则可以存储内容丰富的,图文并茂的文本。

  同一个文件格式,用不同的程序处理可能产生截然不同的结果。例如Word 文件,用Microsoft Word观看的时候,可以看到文本的内容,而以无格式方式在音乐播放软件中播放,产生的则是噪声。一种文件格式对某些软件会产生有意义的结果,对另一些软件来看,就像是毫无用途的数字垃圾。

规范

许多文件格式都有公开的、不同程度规范或者建议的格式。这些规范或者建议描述了数据如何编码,如何排列。有时也规定了是否需要特定的电脑程序读取或处理。有两种情况下,文件格式没有公开。第一种情况是:开发者将文件格式视作商业秘密不愿公开;第二种情况是:开发者不愿意花去很少的时间用于规范文档。

  需要注意的是,使用不公开的文件格式可能会带来额外的成本。要了解这类文件格式或者需要通过对获得的文件进行逆向工程,或者通过向开发者付费来获得文件的格式。第二种方式中往往还需要与开发者签订不扩散协议。不论怎样两种方式都是费时,费钱的。

识别文件的类型

从程序的角度来看,文件是数据流,文件系统为每一种文件格式规定了访问的方法。例如:元数据。不同的操作系统都习惯性的采用各自的方式解决这个问题,每种方式都有各自的优缺点。

  当然,现代的操作系统和应用程序,一般都需要这里所讲述的方法处理不同的文件。

扩展名

 用扩展名识别文件格式的方式最先在数字设备公司的CP/M操作系统被采用。而后又被DOS和Windows操作系统采用。扩展名是指文件名中,最后一个点(.)号后的字母序列。例如,HTML文件通过.htm或.html扩展名识别;GIF图形文件用.gif扩展名识别。在早期的FAT文件系统中,扩展名限制只能是三个字符,因此尽管现在绝大多数的操作系统已不再有此限制,许多文件格式至今仍然采用三个字符作扩展名。因为没有一个正式的扩展名命名标准,所以,有些文件格式可能会采用相同的扩展名,出现这样的情况就会使操作系统错误地识别文件格式,同时也给用户造成困惑。

  扩展名方式的一个特点是,更改文件扩展名会导致系统误判文件格式。例如,将filename.html 简单改名为filename.txt会使系统误将HTML文件识别为纯文本格式。尽管一些熟练的用户可以利用这个特点,但普通用户很容易在改名时发生错误,而使得文件变得无法使用。因此,现代的有些操作系统管理程序,例如Windows Explorer加入了限制向用户显示文件扩展名的功能。

特征签名

一种广泛应用在UNIX及其派生的操作系统上的方法是将一个特殊的数字存放在文件的特定位置里。最初这个数字一般是文件开始处的2个字节。现在一般是将任何可以独一无二字符序列都可以作为特征签名。例如GIF图形文件是将文件开始处的六个字节作为特征签名的,它可以是GIF87a或者GIF89a。但也有些文件很难通过这种方式识别,比如HTML文件。

  采用这种方式可以更好的防止对文件格式发生误判,并且特征签名可以给出关于文件格式的更详细的信息。这种方式的缺点是效率较低。特别是显示大量的文件时,由于每种特征签名具有不同的识别方式,将消耗系统大量的资源对文件格式进行判断。扩展名和后面将提到的元数据方式由于采用固定格式数据,可进行快速匹配。应用程序往往利用特征签名来判断文件是否完整和有效。

注:常见的文件格式请到网站查询。

此文件夹下包含几种不同的文件格式。如图所示:

b8337a543a2ae92835bb441e1b093a85.png

在桌面上找到“Uedit32”软件并打开它,使用ultraedit.exe软件打开1-1.doc文件,如图所示:

7277d77f73601adbf21e83ad6fe0ed28.png

查看打开的1-1.doc文件并查询此文件的格式标识。如图所示:

8ba4bfd73e6855b4bdd10e1313f8096e.png

注:一般在最后几行,出现Microsoft Office Word文档说明此文件格式为word文档。

再次使用Uedit32软件打开1-2-2.gif文件。如图所示:

1e0fa8ca088724013cb8f18f9fa37333.png

查看1-2-2.gif的文件格式。如图所示:

0c2d0bba759924b94bf64c6c9c4d4302.png

继续查看1-2.gif的文件格式,你会发现与1-2-2.gif的文件格式一样。如图:

c8a046d4bca4226add32506566d17a10.png

双击左键打开1-3.rar解压包,可以看到1-1.doc,1-2-2.gif,1-2.gif。如图所示:

29a89a3c943723ab54feb0fb8a02beaf.png

关闭1-3.rar解压包,使用Uedit32软件打开1-3.rar,如图所示:

65bf5b2608e4c0d961873f0ff4fdd7a6.png

我们可以在Uedit32软件中查找到1-3.rar中包含的格式以及1-3.rar里的文件格式。如图所示:

9f4b5d65296f1d11bb1ec17c92fda976.png

使用ultraedit.exe打开1-3.zip文件,操作如1-3.rar一样的步骤。

3015cf5ea088a04af4954bf84ef10c2b.png

根据试验的操作,我们使用ultraedit.exe软件打开1-4的文件,查找显示该文件格式的位置,如图所示:

ca1a97ff58ca6ade0aecee65a56e4c1f.png

查找到格式为Pwoerpoint Document后,可以确定1-4的文件为PPT格式。

修改1-4文件的后缀为1-4.ppt。如图所示:

9b9cc5482cb3cdcd0a0e3227a5975d25.png

双击打开1-4.ppt文件,出现如下图所示说明实验成功:

c1f6909da2c407c8bc726cf58108ea8e.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值