Java 字符编码工具类

原创 2006年06月15日 20:42:00

主要介绍 字符编码及其解码的函数,还有判断是否是UTF-8编码字符的函数

import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;
import java.net.URLDecoder;

/**
*

Title:字符编码工具类


*
Description:


*
Copyright: flashman.com.cn Copyright (c) 2005


*
Company: flashman.com.cn


* @author: jeffzhu
* @version 1.0
*/
public class CharTools {

  /**
   * 转换编码 ISO-8859-1到GB2312
   * @param text
   * @return
   */
  public String ISO2GB(String text) {
    String result = "";
    try {
      result = new String(text.getBytes("ISO-8859-1"), "GB2312");
    }
    catch (UnsupportedEncodingException ex) {
      result = ex.toString();
    }
    return result;
  }

  /**
   * 转换编码 GB2312到ISO-8859-1
   * @param text
   * @return
   */
  public String GB2ISO(String text) {
    String result = "";
    try {
      result = new String(text.getBytes("GB2312"), "ISO-8859-1");
    }
    catch (UnsupportedEncodingException ex) {
      ex.printStackTrace();
    }
    return result;
  }
  /**
   * Utf8URL编码
   * @param s
   * @return
   */
  public String Utf8URLencode(String text) {
    StringBuffer result = new StringBuffer();

    for (int i = 0; i < text.length(); i++) {

      char c = text.charAt(i);
      if (c >= 0 && c <= 255) {
        result.append(c);
      }else {

        byte[] b = new byte[0];
        try {
          b = Character.toString(c).getBytes("UTF-8");
        }catch (Exception ex) {
        }

        for (int j = 0; j < b.length; j++) {
          int k = b[j];
          if (k < 0) k += 256;
          result.append("%" + Integer.toHexString(k).toUpperCase());
        }

      }
    }

    return result.toString();
  }

  /**
   * Utf8URL解码
   * @param text
   * @return
   */
  public String Utf8URLdecode(String text) {
    String result = "";
    int p = 0;

    if (text!=null && text.length()>0){
      text = text.toLowerCase();
      p = text.indexOf("%e");
      if (p == -1) return text;

      while (p != -1) {
        result += text.substring(0, p);
        text = text.substring(p, text.length());
        if (text == "" || text.length() < 9) return result;

        result += CodeToWord(text.substring(0, 9));
        text = text.substring(9, text.length());
        p = text.indexOf("%e");
      }

    }

    return result + text;
  }

  /**
   * utf8URL编码转字符
   * @param text
   * @return
   */
  private String CodeToWord(String text) {
    String result;

    if (Utf8codeCheck(text)) {
      byte[] code = new byte[3];
      code[0] = (byte) (Integer.parseInt(text.substring(1, 3), 16) - 256);
      code[1] = (byte) (Integer.parseInt(text.substring(4, 6), 16) - 256);
      code[2] = (byte) (Integer.parseInt(text.substring(7, 9), 16) - 256);
      try {
        result = new String(code, "UTF-8");
      }catch (UnsupportedEncodingException ex) {
        result = null;
      }
    }
    else {
      result = text;
    }

    return result;
  }

  public static boolean isValidUtf8(byte[] b, int aMaxCount) {
    int lLen = b.length, lCharCount = 0;
    for (int i = 0; i < lLen && lCharCount < aMaxCount; ++lCharCount) {
      byte lByte = b[i++]; //to fast operation, ++ now, ready for the following for(;;)
      if (lByte >= 0) continue; //>=0 is normal ascii
      if (lByte < (byte) 0xc0 || lByte > (byte) 0xfd)
        return false;
      int lCount = lByte > (byte) 0xfc ? 5 : lByte > (byte) 0xf8 ? 4 : lByte > (byte) 0xf0 ? 3 : lByte > (byte) 0xe0 ? 2 : 1;
      if (i + lCount > lLen) return false;
      for (int j = 0; j < lCount; ++j, ++i)
        if (b[i] >= (byte) 0xc0)return false;
    }
    return true;
  }

  /**
   * 编码是否有效
   * @param text
   * @return
   */
  private boolean Utf8codeCheck(String text){
    String sign = "";
    if (text.startsWith("%e"))
      for (int i = 0, p = 0; p != -1; i++) {
        p = text.indexOf("%", p);
        if (p != -1)
          p++;
        sign += p;
      }
    return sign.equals("147-1");
  }

  /**
   * 是否Utf8Url编码
   * @param text
   * @return
   */
  public boolean isUtf8Url(String text) {
    text = text.toLowerCase();
    int p = text.indexOf("%");
    if (p != -1 && text.length() - p > 9) {
      text = text.substring(p, p + 9);
    }
    return Utf8codeCheck(text);
  }

  /**
   * 测试
   * @param args
   */
  public static void main(String[] args) {

    CharTools charTools = new CharTools();

    String url;

    url = "http://www.google.com/search?hl=zh-CN&newwindow=1&q=%E4%B8%AD%E5%9B%BD%E5%A4%A7%E7%99%BE%E7%A7%91%E5%9C%A8%E7%BA%BF%E5%85%A8%E6%96%87%E6%A3%80%E7%B4%A2&btnG=%E6%90%9C%E7%B4%A2&lr=";
    if(charTools.isUtf8Url(url)){
      System.out.println(charTools.Utf8URLdecode(url));
    }else{
      System.out.println(URLDecoder.decode(url));
    }

    url = "http://www.baidu.com/baidu?word=%D6%D0%B9%FA%B4%F3%B0%D9%BF%C6%D4%DA%CF%DF%C8%AB%CE%C4%BC%EC%CB%F7&tn=myie2dg";
    if(charTools.isUtf8Url(url)){
      System.out.println(charTools.Utf8URLdecode(url));
    }else{
      System.out.println(URLDecoder.decode(url));
    }

  }

}

相关文章推荐

Java工具箱之字符编码工具类

涉及到文件的字符编码问题一般需要知道两个内容: 1、文件本身的字符编码是什么? 2、如何将文件的字符编码集转换为另一种呢? 这个工具类就解决这两个问题package com.trigl.util...
  • Trigl
  • Trigl
  • 2016年07月26日 19:26
  • 804

【java工具类】网站安全---将特殊字符编码成为html实体

上两篇文章已经提到javascript的xss攻击问题,针对于 普通文本 假如我要直接在div里面显示用户的输入的信息,譬如: [html] view pla...
  • cdnight
  • cdnight
  • 2013年05月06日 18:47
  • 777

字符编码转换工具

  • 2017年07月12日 09:17
  • 349KB
  • 下载

字符编码转换工具

  • 2008年06月14日 14:27
  • 347KB
  • 下载

黑马程序员--------java IO流 File类、Properties、打印流、合并流、对象序列化、随机读写、字符编码

-----------android培训、java培训、java学习型技术博客、期待与您交流!------------ File类   1、用来将文件或者文件夹封装成对象, 方便对文件与文件夹...

JAVA_字符编码

  • 2012年08月16日 11:43
  • 51KB
  • 下载

JAVA字符编码问题总结

  • 2013年06月20日 14:39
  • 25KB
  • 下载

JAVA基础 day23 IO流的其他类 (对象的序列化 管道流 RandomAccessFile类(随机读取文件) DateStream(操作基本数据类型的流) 操作数组的流 )字符编码问题

IO流其他类对象的序列化 序列化:把Java对象转换为字节序列的过程。 反序列化:把字节序列恢复为Java对象的过程用途:把对象的字节序列永久的保存到硬盘上,通常存在文件中。 ...

JAVA中文字符编码问题详解.doc

  • 2010年09月16日 23:15
  • 142KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Java 字符编码工具类
举报原因:
原因补充:

(最多只允许输入30个字)