php的汉字转换: GBK->Unicode(UTF8)

原创 2002年08月15日 23:06:00

php的汉字转换一直是比较麻烦的事

该类内置了四个函数"htmlHex","htmlDec","escape","u2utf8"
方便用户的使用,同时也可自定义函数进行自己喜欢的操作

qswhGBK.php 从这里下载
http://www.blueidea.com/user/qswh/qswhGBK.zip

<?
class qswhGBK{
 var $qswhData;
 function qswhGBK($filename="qswhGBK.php"){
  $this->qswhData=file($filename);
 }
 function gb2u($gb,$callback=""){
  /******(qiushuiwuhen 2002-8-15)******/
  $ret="";
  for($i=0;$i<strlen($gb);$i++){
   if(($p=ord(substr($gb,$i,1)))>127){
    
    $q=ord(substr($gb,++$i,1));
    $q=($q-($q>128?65:64))*4;
    $q=substr($this->qswhData[$p-128],$q,4);
   }
   else
    $q=dechex($p);
   if(empty($callback))
    $ret.=$q;
   else {
    $arr=array("htmlHex","htmlDec","escape","u2utf8");
    if(is_integer($callback)){
     if($callback>count($arr))die("Invalid Function");
     $ret.=$this->$arr[$callback-1]($q);
    }else
     $ret.=$callback($q);
   }
  }
  return $ret;
 }
 
 function htmlHex($str){
  return "&#x".$str.";";
 }
 
 function htmlDec($str){
  return "&#".hexdec($str).";";
 }
 
 function escape($str){
  return hexdec($str)<256?chr(hexdec($str)):"%u".$str;
 }
 
 function u2utf8($str){
  /******(qiushuiwuhen 2002-8-15)******/
  $sp="!'()*-.0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ_abcdefghijklmnopqrstuvwxyz~";
  $dec=hexdec($str);
  $bin=decbin($dec);
  $len=strlen($bin);
  $arr=array("c0","e0","f0");
  if($dec>0x7f){
   $ret="";
   for($i=$len,$j=-1;$i>=0;$i-=6,$j++){
    if($i>6)
     $ret="%".dechex(0x80+bindec(substr($bin,$i-6,6))).$ret;
    else
     $ret="%".dechex(hexdec($arr[$j])+bindec(substr($bin,0,6-$i))).$ret;
   }
  }else{
   if(strpos($sp,chr($dec)))
    $ret=chr($dec);
   else
    $ret="%".strtolower($str);
  }
  return $ret;
 }
}

使用范例
$words="中文Abc";
function ex($str){return "[".$str."]";}


$qswh=new qswhGBK("qswhGBK.php");//如果文件名是qswhGBK.php,可省参数

echo("<xmp>不带参数:".$qswh->gb2u($words));
echo("/n调用内置函数htmlHex:".$qswh->gb2u($words,1));
echo("/n调用内置函数htmlDec:".$qswh->gb2u($words,2));
echo("/n调用内置函数escape:".$qswh->gb2u($words,3));
echo("/n调用内置函数u2utf8:".$qswh->gb2u($words,4));
echo("/n调用自定义函数:".$qswh->gb2u($words,ex));

效果如下:

不带参数:4E2D6587416263 调用内置函数htmlHex:中文Abc 调用内置函数htmlDec:中文Abc 调用内置函数escape:%u4E2D%u6587Abc 调用内置函数u2utf8:%e4%b8%ad%e6%96%87Abc 调用自定义函数:[4E2D][6587][41][62][63]

ps.该文章现仅限在csdn文档中心,如要转载,请和作者联系,否则后果自负。

libIconv库实现中文中字符串与GBK、Unicode、UTF-8三种编码互转

libIconv库实现GBK、Unicode、UTF-8三种编码互转比window api更为简单,而且libIconv库跨平台。 IibIconv库在windows下的编译参照windows下使用V...
  • bladeandmaster88
  • bladeandmaster88
  • 2017年02月01日 23:32
  • 2220

windows API实现中文中字符串与GBK、Unicode、UTF-8三种编码互转

#include #include #include using namespace std; //gbk转UTF-8 string GbkToUtf8(const std::string& ...
  • bladeandmaster88
  • bladeandmaster88
  • 2017年01月31日 21:39
  • 2300

VC++互相转码GBK,unicode,utf8

windows平台下微软的库自带了一些api可用于几种编码格式间的互相转码,其实可以用一个iconv开源跨平台的转码库,那个方法更方便且统一。 使用前要引入头文件和命名空间 #include ...
  • u012234115
  • u012234115
  • 2014年12月31日 10:47
  • 2168

查询任意汉字的Unicode编码,UTF8编码,GB2312编码,GBK编码

在所有IT项目中,汉字字符编码带来的问题是一个不小的工作量,经常导致乱码的发生。 快速查询任意汉字的编码能够更快的定位错误。 糖果云库新增了汉字字符集库,可查询任意汉字的Unicode编码,UTF...
  • bigtang5
  • bigtang5
  • 2017年11月11日 16:14
  • 124

.net六种汉字代码转换(gbk_utf8_u…

.net六种汉字代码转换(gbk_utf8_unicode) private void button1_Click(object sender, EventArgs e)         {     ...
  • esonbest1234
  • esonbest1234
  • 2016年02月24日 11:35
  • 197

Java实现的utf8,gbk,unicode编码相互转换的代码

public class UTF2GBK { public String gbk2utf8(String gbk) { String l_temp = GBK2Unicode(gbk); ...
  • xyw_Eliot
  • xyw_Eliot
  • 2013年04月21日 10:43
  • 1702

char, wchar_t,UTF8,UNICODE,GBK转换

1 char* 转换为wchar_t view plaincopy to clipboardprint?//char* to wchar_t   wchar_t wfilename[256] ={0}...
  • normallife
  • normallife
  • 2011年01月19日 18:02
  • 7187

不依赖任何系统API,用c语言实现gbk/utf8/unicode编码转换

汉字'我' Unicode编码是 0x6211       01100010 00010001 UTF8编码是    0xe68891    11100110 10001000 100010001 ...
  • bladeandmaster88
  • bladeandmaster88
  • 2017年02月02日 19:10
  • 1489

C/C++ 各种字符编码字符串的转换 可用于XML文件的字符转化读写 (收集 GBK - UTF8 - Unicode - ANSI )

下文中的所有代码,主要涉及两个中的函数MultiByteToWideChar、WideCharToMultiByte,所以在使用的时候注意#include -----------GBK - UTF...
  • Forrest_Chen
  • Forrest_Chen
  • 2012年06月14日 10:46
  • 1844

Java实现的utf8,gbk,unicode编码相互转换的代码

http://www.sharejs.com/codes/java/5422   public class UTF2GBK {    public String gbk2utf8(String...
  • tiantangpw
  • tiantangpw
  • 2015年04月10日 16:56
  • 309
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:php的汉字转换: GBK->Unicode(UTF8)
举报原因:
原因补充:

(最多只允许输入30个字)