通常,数据以位(1或0)的形式存储在计算机中。有多种可用的编码方案来指定每个字符代表的字节集。
Unicode(UTF) -代表Unicode转换格式。它是由Unicode联盟开发的。如果要创建使用来自多个字符集的字符的文档,则可以使用单个Unicode字符编码来创建。它提供3种类型的编码。UTF-8-它以8位为单位(字节),UTF8中的字符长度可以从1到4个字节,从而使UTF8的宽度可变。
UTF-16-它以16位为单位(短字节),长度可以是1或2个短字节,从而使UTF16的宽度可变。
UTF-32-它以32位单元(长)为单位。它是一种固定宽度的格式,长度始终为1“长”。
将UTF数据写入文件
java.io.DataOutputStream的readUTF()方法将经过修改的UTF-8编码的数据读取到String中并返回。因此要读取UTF-8数据到文件-通过传递表示所需文件路径的String值作为参数来实例化FileInputStream类。
实例化DataInputStream类,绕过上面创建的FileInputStream对象作为参数。
使用readUTF()方法从InputStream对象读取UTF数据。
示例import java.io.DataInputStream;
import java.io.EOFException;
import java.io.FileInputStream;
import java.io.IOException;
public class UTF8Example {
public static void main(String args[]) {
StringBuffer buffer = new StringBuffer();
try {