文本文件和二进制文件

原创 2007年09月24日 15:44:00
Java提供了很多进行文件输入输出的类,这些类可以分为文本I/O类和二进制I/O类。文本I/O将数据解释成字符的序列,二进制I/O将数据解释成原始的二进制数。文本在文件中如何存储依赖于文件的编码方式。Java对文本I/O提供自动编码与解码
在文本文件中存储的数据是以人能读懂的方式表示的,而在二进制文件中存储的数据是用二进制形式来表示的。人读不懂二进制文件,它们是为程序读取而设计的。例如,Java源程序存储在文本文件中,可以使用文本编辑器阅读,但是Java的类存储在二进制文件中,使用Java虚拟机阅读。二进制文件的好处是处理它们的效率比文本文件高
文本文件是字符的序列构成的,二进制文件是由位的序列构成的。例如,十进制整数199在文本文件中是以三个字符序列‘1’、‘9’、‘9’来存储的,而在二进制文件中它是以byte类型的值C7存储的
1、文本输入输出
Java用于文本输入输出的类:
Reader:一个读取字符的抽象基类
Writer:一个向文件中写入字符的抽象基类
FileReader:以主机上默认的编码方式从文件中读取字符的类
FileWriter:以主机上的默认编码方式向文件中写入字符的类
BufferedReader:一个从缓冲区读取字符的类
BufferedWriter:一个向缓冲区写入字符的类
PrintWriter:以文本方式输出基本类型值、字符和字符串
PrintStream:与PrintWriter类似,只是向控制台输出
PrintWriter类和PrintSream类可以将对象、字符串和数值以文本的方式输出
out是定义在System类中类型为PrintStream的一个静态变量。默认情况下,out表示标准输出设备,也就是屏幕。可以使用System.setOut(PrintStream)设置新的out
InputStreamReader类:以指定的编码方案从文件中读取字符的类
OutpitStreamWriter类:以指定的编码方案向文件中写入字符的类
InputStreamReader类和OutpitStreamWriter类用于实现字符和字节之间的转化。写入OutpitStreamWriter的字符用指定的编码方案翻译为字节,同样,从InputStreamReader类读出的字符用指定的编码方案解码为字符。可以使用InputStreamReader类和OutpitStreamWriter类的构造函数指定编码方案,如果没有指定它,采用系统默认的编码方案
InputStreamReader类和OutpitStreamWriter类的getEncoding()方法返回这个数据流使用的编码方案名称
java程序使用的是统一码(Unicode),从FileReader流中读取一个字符时,返回该字符的统一码。字符在文件中的编码可能不是统一码,Java自动将统一码转换为文件指定的编码
2、二进制输入输出
文本输入输出需要进行编码与解码操作,向文件写入字符时,Java虚拟机将输出字符的统一码转化为文件指定的编码,对应地,从文件读取字符时,将文件中指定的编码转化为统一码。二进制输入输出不要求这些转化,向文件写入字节,就是将源字节复制到文件中,从文件读取字节,就是将文件中的字节原样返回
例如,假设使用文本I/O将字符‘9’写入文件。由于字符‘9’的统一码是0x0039,所以会根据文件的编码方案将统一码为0x0039转化成新的编码。如果用二进制I/O将一个值存入文件,那么该整数在内存中的精确值被复制到文件中
由于二进制I/O不需要编码和解码,所以要比文件I/O效率高。二进制文件与主机的编码方案无关,因而是可移植的,所以Java程序可以在任何机器上访问Java程序创建的二进制文件。这也是把Java的类文件存储为二进制文件的原因,因为Java类文件可以在任何具有Java虚拟机的机器上运行
Java用于二进制输入输出的类:
InputStream:用于字节输入流的抽象基类
OutputStream:用于字节输出流的抽象基类
FileInputStream:一个从文件读取字节的类
FileOutputStream:一个向文件写入字节的类
DataInputStream:用于读取基本类型数据值和字符串的类
DataOutputStream:用于输出基本类型数据值和字符串的类
BufferedInputStream:一个从缓冲区读取字节的类
BufferedOutputStream:一个向缓冲区内写入字节的类
FilterInputStream类和FilterOutputStream类:
过滤器数据流是为某种目的过滤字节的数据流。基本字节数如流提供的读取方法只能用来读取字节。如果想要读取整数值、双精度值或字符串,需要一个过滤器类来包装输入流。使用过滤器类就可以读取整数值双精度值或字符串,而不仅仅是字节或字符
DataInputStream扩展了FilterInputStream类并实现了DataInput接口,实现了定义在DataInput接口中读取基本类型值和字符串的方法
DataOutputStream扩展了FilterOutputStream类并实现了DataOutput接口,实现了定义在DataOutput接口中输出基本类型值和字符串的方法
3、小结
从本质上说所有文件都是二进制文件,文本I/O是在二进制I/O基础上提供的一层抽象,它封装了字符的编码和解码过程。在文本I/O中自动进行编码与解码。对于二进制输入,要想能够以正确的类型和正确的顺序读取,并须准确地了解数据是如何让写入的
将一个字节写入字节流时,字节的确切值发送到输出流。将一个字符写入字符流时,字符按照编码方案转换成它对应的数值。
从字节流中读取一个字节时,是从输入流读出一个字节的值。而从字符流中读取一个字符时,读取稽几个字节依赖于编码系统
ACSII码占8位,Java使用的是16位的Unicode码。当一个统一码无法转换为ACSII码时,转换为字符‘?’。例如,如果想把统一码‘u03b1写到字符流中,送入到字符流的是数值63(表示字符‘?’)。
文本文件依赖于主机所使用的编码系统,所以将一个文本文件从一台机器转到另一台机器上时,如果两台机器的编码不同,可能会出现错误
 
 
版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

windows下C/C++中的二进制文件与文本文件

首先,二进制文件,文本文件

文本文件与二进制文件

一、文本文件与二进制文件的定义    大家都知道计算机的存储在物理上是二进制的,所以文本文件与二进制文件的区别并不是物理上的,而是逻辑上的。这两者只是在编码层次上有差异。    简单来说,文本文件是基...

文本文件与二进制文件

fopen 文本文件与二进制文件区别 今天在写文件的时候发现fwrite的时候多出了一些乱码,最后发现加个b,以二进制的方式打开文件就解决了,google了.... 特记与此 在学习C语言文件...
  • tms_li
  • tms_li
  • 2011-03-17 21:51
  • 1321

文本文件与二进制文件

转自:http://www.cnblogs.com/xbspring/archive/2009/01/08/1371696.html 今天在网上看到一篇关于文本文件和二进制文件区别的介绍,看着还比较...

122 C语言中文本文件与二进制文件的区别

C学习网:链接->C学习网 C训练网:链接->C训练网 在学习C语言fopen()函数后,知道它的第二个参数是标志字符串。如果字符串中出现'b',则表明是以打开二进制(binary)文件,否则是打开...

文本文件与二进制文件区别

一、文本文件与二进制文件的定义     大家都知道计算机的存储在物理上是二进制的,所以文本文件与二进制文件的区别并不是物理上的,而是逻辑上的。这两者只是在编码层次上有差异。简单来说,文本文件是基...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)