BIG5是目前中国台湾和中国香港地区普遍使用的一种繁体汉字的编码标准,包括440个符号,一级汉字5401个,二级汉字7652个,共计13060个汉字,所谓一级汉字与二级汉字对应于常用汉字和不常用汉字。
关于编码问题可参考我的另一篇文章:我所了解的GB2312、Unicode、GBK、UTF-8、BIG5等编码。
本文主要通过 java 输出13060个繁体字集的Unicode码。本文例子中输入文件为BIG5_F.txt,其内容是BIG5编码的繁体汉字集,你可随意输入文本文件进行转换。
代码及注释:
/*
功能:得知文本文件里文字的Unicode码
输入:需要转换为Unicode的.txt文本文件
输出:输入的所有文字及对应的Unicode码的.txt文件
方法及描述:1个,自己写的getUnicode()
第一步:读取输入字符串参数;
第二步:依次转成int、hex;
第三步:字符串变数组;
第四步:输出文字和Unicode码
author:杨陈菊
*/
import java.io.File;//引入File类
import java.util.Scanner;//引入Scanner类,用于从文件读数据
import java.io.PrintWriter;//引入PrintWriter类,用于写数据入文件
import java.io