java 随机 获取 汉字

发代码之前先转段预备知识
计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。
汉字信息在系统内传送的过程就是汉字编码转换的过程。
汉字交换码:汉字信息处理系统之间或通信系统之间传输信息时,对每一个汉字所规定的统一编码,我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集——基本集”,代号为GB 2312—80,又称为“国标码”。
国标码:所有汉字编码都应该遵循这一标准,汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出设备的汉字地址码等,都以此标准为基础。GB2312—80就是国标码。该码规定:一个汉字用两个字节表示,每个字节只有7位,与ASCII码相似。
区位码:将GB2312—80的全部字符集组成一个94×94的方阵,每一行称为一个“区”,编号为0l~94;每一列称为一个“位”,编号为0l~94,这样得到GB2312—80的区位图,用区位图的位置来表示的汉字编码,称为区位码。
机内码:为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。
汉字机内码、国标码和区位码三者之间的关系为:
区位码(十进制)的两个字节分别转换为十六进制后加20H得到对应的国标码;
机内码是汉字交换码(国标码)两个字节的最高位分别加1 ,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;
区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。
原文地址:http://www.51testing.com/?uid-202848-action-viewspace-itemid-123415
新增获取随机汉字方法,代码已测试可以直接使用
package com.test;

public class TestChinese {

 
   publicstatic String bytes2HexString(byte b) {
      return bytes2HexString(new byte[] { b });
    }

    //汉字转换成区位码
    publicstatic String bytes2HexString(byte[] b) {
      String ret = "";
      for (int i = 0; i < b.length; i++){
         String hex = Integer.toHexString(b[i]& 0xFF);
         if (hex.length() == 1) {
            hex = '0' + hex;
         }
         ret += hex.toUpperCase();
      }
      return ret;
    }

    //汉字转换成区位码
    publicstatic String getString(String chinese) {
      byte[] bs;
      String s = "";
      try {
         bs = chinese.getBytes("GB2312");

         for (int i = 0; i < bs.length;i++) {
            int a = Integer.parseInt(bytes2HexString(bs[i]),16);
            s += (a - 0x80 - 0x20) + "";
         }
      } catch (Exception e) {
         e.printStackTrace();
      }
      return s;
    }
    
    //区位码转换成汉字
    publicstatic String CodeToChinese(String code) {
       StringChinese = "";
       for (int i =0; i < code.length(); i += 4) {
          byte[] bytes= new byte[2];
          StringlowCode = code.substring(i, i + 2);
          int tempLow= Integer.parseInt(lowCode);
          tempLow +=160;
          bytes[0] =(byte) tempLow;
          StringhighCode = code.substring(i + 2, i + 4);
          int tempHigh= Integer.parseInt(highCode);
          tempHigh +=160;
          bytes[1] =(byte) tempHigh;
          String chara= new String(bytes);
          Chinese +=chara;
       }
       returnChinese;
    }
   
   //获得指定范围的随机数
//@param min 最小值
//@param max 最大值
//@return 返回值
    publicstatic int pickRandom(int min, int max) {
       return (int)(Math.random() * (max - min + 1) + min);
    }

   //区码: 汉字内码高位 - 0xA0 位码: 汉字内码低位-0xa0          
//区号:01-87,汉字从16区开始,前15区为各种符号                
//位号:01-94                                                 
//第一个汉字“啊”的区号为16,位号为01续:                    
//两字节内码:区号+0xA0 ,位号+0xa0                            
//如:第一个汉字“啊”的区号为16,位号为01,则其内码为 0xb0,0xa1
//======> 区号:16---87 位号:01---94
    publicstatic String RandomName() {
       String name= "";
       int time =pickRandom(2, 4);
       for (int i =0; i < time; i++) {
          int qu =pickRandom(16, 87);
          int wei =pickRandom(1, 94);
          String code= "";
          if (wei< 10) {
             code =String.valueOf(qu) + "0" + String.valueOf(wei);
          } else{
             code =String.valueOf(qu) + String.valueOf(wei);
          }
          name +=CodeToChinese(code);
       }
       returnname;
   }   
   
    // 测试
    publicstatic void main(String[] args) throws Exception {
       String str ="创";
       String s =TestChinese.getString(str);
      System.out.println(s);
       String a =TestChinese.CodeToChinese(s);
      System.out.println(a);
       a =TestChinese.CodeToChinese("1601");
      System.out.println(a);
       //获得随机的名字2~4 个汉字
      //同百家姓是对不上的,如果要真正的姓名,需要建立姓的数组
       for(int i =0 ; i < 100 ; i++)
         System.out.println(RandomName());
      
    }
}
 


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值