学习笔记（java）①⑧（字符流）

最新推荐文章于 2024-10-16 16:34:42 发布

LeTmeWith

最新推荐文章于 2024-10-16 16:34:42 发布

阅读量94

点赞数

文章标签： java

本文链接：https://blog.csdn.net/m0_56655954/article/details/119728121

版权

1.字符流

为什么会出现字符流

由于字节操作中中文不是特别的方便，所以Java就提供字符流

字符流=字节流+编码表

用字节流复制文本文件时，文本文件也会有中文，但是没有问题，原因是最终底层操作会自动进行字节拼接成中文，如何识别是中文的呢？

汉字在存储的时候，无论选择哪一种编码存储，第一个字节都是负数

编码表

基础知识：

①计算机中存储的信息都是用二进制数表示的；我们在屏幕上看到的英文，汉字等字符是二进制数转换之后的结果

②按照某种规则，将字符存储到计算机中，称为编码。反之，将存储在计算机中的二进制数按照某种规则解析显示出来，称为解码。这里强调一下：按照A编码存储，必须按照A编码解析，这样才能显示正确的文本符号。否则就会导致乱码现象

字符编码：就是一套自然语言的字符与二进制数之间的对应规则（A,65）

字符集

①是一个系统支持的所有字符的集合，包括各国家文字，标点符号，图形符号，数字等

②计算机要准确的存储和识别各种字符集符号，就需要进行字符编码，一套字符集必然至少有一套字符编码。常见字符集有ASCⅡ字符集，GBXXX字符集，Unicode字符集等

ASCⅡ字符集：

①ASCⅡ（American Standard Code for Information Interchange，美国信息交换标准代码）：是基于拉丁字母的一套电脑编码系统，用于显示现代英语，主要包括控制字符（回车键，退格，换行键等）和可显示字符（英文大小写字符，阿拉伯数字和西文符号）

②基本的ASCⅡ字符集，使用7位表示一个字符，共128字符。ASCⅡ的扩展字符集使用8位表示一个字符，共256字符，方便支持欧洲常用字符。是一个系统支持的所有字符的集合，包括各国家文字，标点符号，图形符号，数字等

GBXXX字符集

GB2312：简体中文码表。一个小于127的字符的意义与原来相同，但两个大于127的字符连在一起时，就表示一个汉字，这样大约可以组合了包含7000多个简体汉字，此外数学符号，罗马希腊的字母，日文的假名等都编进去了，连在ASCⅡ里本来就有的数字，标点，字母都统统重新编了两个字节长的编码，这样就是常说的"全角"字符，而原来在127号以下的那些就叫"半角"字符了

GBK：最常用的中文码表。是在GB2312标准基础上的扩展规范，使用了双字节编码方案，共收录了21003个汉字，完全兼容GB2312标准，同时支持繁体汉字以及日韩汉字等

GB18030：最新的中文码表。收录汉字70244个，采用多字节编码，每个字可以由1个，2个或4个字节组成。支持中国国内少数民族的文字，同时支持繁体汉字以及日韩汉字等

Unicode字符集

为表达任意语言的任意字符而设计的，是业界的一种标准，也称统一码，标准万国码，它最多使用4个字节的数字来表达每个字母。符号，或者文字。有三种编码方案，UTF-8，UTF-16和UTF32。最为常用的UTF-8编码

UTF-8编码：可以用来表示Unicode标准中任意字符，它是电子邮件，网页以及其他存储或传送文字的应用中，优先采用的编码。互联网工程工作小组（IETF）要求所有互联网协议都必须支持UTF-8编码。它使用一至四个字节为每个字符编码

编码规则：

128个US-ASCⅡ字符，只需一个字节编码

拉丁文等字符，需要两个字节编码

大部分常用字（含中文），使用三个字节编码

其他极少数使用的Unicode辅助字符，使用四字节编码

小结：采用何种规则编码，就要采用对应规则解码，否则就会出现乱码

字符串中的编码解码问题

编码：

①byte[ ] getBytes( )：使用平台的默认字符集将该String编码为一系列字节，将结果存储到新的字节数组中

②byte[ ] getBytes(String charsetName)：使用指定的字符集将该String编码为一系列字节，将结果存储到新的字节数组中

解码：

①String(byte[ ] bytes)：通过使用平台的默认字符集解码指定的字节数组来构造新的String

②String(byte[ ] bytes，String charsetName)：通过指定的字符集解码指定的字节数组来构造新的 String

字符流中的编码解码问题

字符流抽象基类

①Reader：字符输入流的抽象类

②Writer：字符输出流的抽象类

字符流中和编码解码问题相关的两个类

①InputStreamReader

②OutputStreamWriter

字符流写数据的5种方式

方法名	说明
void write(int c)	写一个字符
void write(char[ ] cbuf)	写入一个字符数组
void write(char[ ] cbuf,int off,int len)	写入字符数组的一部分
void write(String str)	写一个字符串
void write(String str,int off,int len)	写一个字符串的一部分

方法名	方法
flush( )	刷新流，还可以继续写数据
close( )	关闭流，释放资源，但是在关闭之前会先刷新流。一旦关闭，就不能再写数据

字符流读数据的2种方式

方法名	说明
int read( )	一次读一个字符数据
int read(char[ ] cbuf)	一次读一个字符数组数据

字符缓冲流

字符缓冲流：

①BufferedWriter：将文本写入字符输出流，缓冲字符，以提供单个字符，数组和字符串的高效写入，可以指定缓冲区大小，或者可以接受默认大小。默认值足够大，可用于大多数用途

②BufferedReader：从字符输入流读取文本，缓冲字符，以提供字符，数组和行的高效读取，可以指定缓冲区大小，或者可以使用默认大小。默认值足够大，可用于大多数用途

构造方法：

①BufferedWrite(Write out)

②BufferedReader(Reader in)

字符缓冲流特有功能

①BufferedWrite：

void newLine( )：写一行行分隔符，行分隔符字符串由系统属性定义

②BufferedReader：

public String readLine( )：读一行文字。结果包含行的内容的字符串，不包括任何行终止字符，如果流的结尾已经达到，则为null

IO流小结

小结：字节流可以复制任意文件数据,有4种方式一般采用字节缓冲流一次读写一个字节数组的方式

小结：字符流只能复制文本数据，有5种方式，一般采用字符缓冲流的特有功能

复制文件的异常处理

try...catch...finally的做法：

try{
    可能出现异常的代码;
}catch(异常类名 变量名){
    异常的处理代码;
}finally{
    执行所有清除操作;
}

JDK7改进方案：

try(定义流对象){
    可能出现异常的代码;
}catch(异常类名 变量名){
    异常的处理代码;
}

自动释放资源

JDK9改进方法：

定义输入流对象;
定义输出流对象;
try(输入流对象;输出流对象){
    可能出现异常的代码;
}catch(异常类名 变量名){
    异常的处理代码;
}

自动释放资源

LeTmeWith

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫