BASE64与UNICODE-CSDN博客

为什么80%的码农都做不了架构师？>>>

在公司跟别人做了一个项目，基于规则引擎Drools开发的一个相当于编写Drools脚本的工具项目。为了简化Drools自带工具的繁琐操作和概念上的理解困难，从应用的角度出发，站在业务角度维护规则。利用模型+参数+属性建立模型，再组织成规则表达式，其中有个关键点是，业务人员对于一些模型、参数、属性的命名上不太好把握。所以采用中文的方式命名更容易被业务人员接受，那问题就来了。Drools文件里和Java一样不支持中文命名变量。所以就有了项目中目前采用的转换中文为UNICODE码的方式作为变量名称。本来也没有的多想这件事情就很顺其自然的被接受了，但今天看生成的规则文件时（以前都是其他同事搞这个文件生成），发现生成的文件中变量命名过于冗长。例如：中华人民共和国转换UNICODE码后，替换掉\u后是：354c69743559324f354c71363572435235595778355a4b4d355a7539

实现程序如下：

/**
   * 字符串转换unicode
   */
   public static String string2Unicode(String string) {
         StringBuffer unicode = new StringBuffer();
         for (int i = 0; i < string.length(); i++) {
      // 取出每一个字符
   char c = string.charAt(i);
      // 转换为unicode
   unicode.append("\\u" + Integer.toHexString(c));
   }
      return unicode.toString();
   }

   /**
   * unicode 转字符串
   */
   public static String unicode2String(String unicode) {
      StringBuffer string = new StringBuffer();
      String[] hex = unicode.split("\\\\u");
      for (int i = 1; i < hex.length; i++) {
      // 转换出每一个代码点
   int data = Integer.parseInt(hex[i], 16);
      // 追加成string
   string.append((char) data);
   }
      return string.toString();
   }