java中GB2312 To Utf-8字符互换

最新推荐文章于 2021-10-31 16:25:55 发布

brook19

最新推荐文章于 2021-10-31 16:25:55 发布

阅读量831

点赞数

分类专栏： JAVA 文章标签： Java J# F#

本文链接：https://blog.csdn.net/brook19/article/details/83844438

版权

实现思路大致如下：
取得一个汉字的Unicode码
把Unicode码分解为两个16进制数据字符串（丢弃前两个字节）
把这两个16进制数据字符串转换成二进制数据字符串
把二进制数据字符串分解为三个串，第一个串为4（0~4）个位，在高位加上标记位“1110”，第二（4~10）、三个（10~16）串均为6个位，分别在高位加上“10”标记位
把这三个二进制串分别转换为10进制数据并赋值给字节型数组
根据这个字节型数组构造UTF-8字符
java 代码

import java.io.File;
import java.io.FileOutputStream;
import java.io.UnsupportedEncodingException;

/**
* 2007-8-10 jyin at gomez dot com
*/
public class CharsetConvertor {
public static void main(String[] args) {
String str = "This is a test for *中网!@#$。，？";
try {
File f = new File("D:/test.txt");
FileOutputStream fio = new FileOutputStream(f);
String s = gbToUtf8(str);
fio.write(s.getBytes("UTF-8"));
fio.close();
}
catch (Ex

最低0.47元/天解锁文章

brook19

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
java中GB2312 To Utf-8字符互换

实现思路大致如下：取得一个汉字的Unicode码把Unicode码分解为两个16进制数据字符串（丢弃前两个字节）把这两个16进制数据字符串转换成二进制数据字符串把二进制数据字符串分解为三个串，第一个串为4（0~4）个位，在高位加上标记位“1110”，第二（4~10）、三个（10~16）串均为6个位，分别在高位加上“10”标记位把这三个二进制串分别转换为10进制数据并赋值给字...
复制链接

扫一扫

专栏目录