Java的IO_04字符集和编码解码

字符集

定义:Java字符使用16位的双字节存储,但是在实际文件存储的数据有各
种字符集,需要正确操作,否则就有乱码的发生。

字符集说明
US-ASCII即英文的ASCII
ISO-8859-1Latin-1 拉丁字符,包含中文、日文等
UTF-8变长unicode字符(1-3个字节),国际通用
UTF-16BE定长unicode字符(2个字节),大端Big-endian表示 高字节低地址 0x12
UTF-16LE定长unicode字符(2个字节),小端little-endian表示 低字节低地址 0x78
UTF-16文件中开头指定大端还是小端表示方式,即BOM(ByteOrder-Mark) :FE FF 表示大端, FF FE 表示小端.

补充:
GBK
作用:它是GB2312的扩展,加入对繁体字的支持,兼容GB2312。
位数:使用2个字节表示,可表示21886个字符。
范围:高字节从81到FE,低字节从40到FE。
字节——>字符(解码)
字符——>字节(编码)

编码与解码

编码

package com.io.cx;

import java.io.File;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;

/**
 * 编码: 字符串-->字节数组
 *
 */
public class encode {

	public static void main(String[] args) throws IOException {
		String msg ="你好a";
		//编码: 字节数组
		byte[] datas = msg.getBytes();  //默认使用工程的字符集
		System.out.println(datas.length);//UTF-8一个中文占3个,GBK一个中文占2个
		
		//编码: 其他字符集
		datas = msg.getBytes("UTF-16LE");//每个是两个字节
		System.out.println(datas.length);
		
		datas = msg.getBytes("GBK");//中文两个,英文一个
		System.out.println(datas.length);	
		datas = msg.getBytes("UTF-8");//中文三个,英文一个
		System.out.println(datas.length);	
		
	}

}

解码

package com.io.cx;

import java.io.UnsupportedEncodingException;

/**
 * 解码: 字节->字符串
 */
public class decode {

	public static void main(String[] args) throws UnsupportedEncodingException {
		String msg ="你好a";
		//编码: 字节数组
		byte[] datas = msg.getBytes();  //默认使用工程的字符集
		
		//解码: 字符串 String​(byte[] bytes, int offset, int length, String charsetName)
		msg = new String(datas,0,datas.length,"utf8");
		System.out.println(msg);
		
		
		//乱码: 
		//1)、字节数不够
		msg = new String(datas,0,datas.length-2,"utf8");
		System.out.println(msg);
		msg = new String(datas,0,datas.length-1,"utf8");
		System.out.println(msg);
		
		//2)、字符集不统一
		msg = new String(datas,0,datas.length-1,"utf8");
		System.out.println(msg);
		
	}

}

1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 、4下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合;、下载 4使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合;、 4下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.m或d论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 、1资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值