字符编码
常见编码:
- GBK、GB2312:表示的是国标编码,GBK包含简体中文和繁体中文,而GB2312只包含简体中文。也就是说,这两种编码都是描述中文的编码。
- UNICODE编码:java提供的16进制编码,可以描述世界上任意的文字信息,但是有个问题,如果现在所有的字母也都使用16进制编码,那么这个编码太庞大了,会造成网络传输的负担。
- ISO8859-1:国际通用编码,但是所有的编码都需要进行转换。
- UTF编码:相当于结合了UNICODE、ISO8859-1,也就是说需要使用到16进制文字使用UNICODE,而如果只是字母就使用ISO8859-1,而常用的就是UTF-8编码形式。
package www.bittech;
import java.io.*;
public class Test {
public static void main(String[] args) throws UnsupportedEncodingException,IOException{
OutputStream out=new FileOutputStream(
new File("E:"+File.separator+"1"+File.separator+"test.txt"));
out.write("你好!".getBytes("ISO8859-1")) ;
out.close();
}
}
此代码会产生乱码,产生乱码本质:编码和解码不统一产生的问题。
内存操作流
除了文件之外,IO的操作也可以发生在内存之中,这种流称之为内存操作流。文件流的操作里面一定会产生一个文件数据(不管最后这个文件数据是否被保留)。
内存流分类:
1.字节内存流:ByteArrayInputStream、ByteArrayOutputStream
2.字符内存流:CharArrayReader、CharArrayWriter
ByteArrayInputStream和ByteArrayOutputStream的构造方法:
public ByteArrayInputStream(byte buf[])
public ByteArrayOutputStream()
内存流的继承关系:
通过内存流实现大小写转换:
package www.bittech;
import java.io.*;
public class Test {
public static void main(String[] args)throws IOException {
String msg="Hello!";
//实例化InputStream类对象,实例化的时候需要将你操作的数据保存到内存之中
//最终读取的就是你设置的内容。
InputStream input=new ByteArrayInputStream(msg.getBytes());
OutputStream output=new ByteArrayOutputStream();
int temp = 0 ;
while((temp = input.read()) != -1) {
// 每个字节进行处理,处理之后所有数据都在outputStream类中
output.write(Character.toUpperCase(temp)) ;//转大写
}
// 直接输出output对象
System.out.println(output) ;
input.close() ;
output.close() ;
}
}
这个时候发生了IO操作,但是没有文件产生,可以理解为一个临时文件处理。
内存流特点:
1.数据在内存中进行操作,不与文件系统关联
2.适合处理少量的数据
内存流操作
内存操作流还有一个很小的功能,可以实现两个文件的合并处理(文件量不大)。
合并文件:
方案一:
1.test1.txt内容复制到test.txt
2.test2.txt内容复制追加到test.txt
方案二:
1.test1.txt复制到内存的输出流
2.test2.txt复制到内存的输出流
3.内存输出流->byte[]字节流
4.byte[]->输出到文件的输出流