php的汉字转换: Unicode(UTF8)->GBK

原创 2002年08月16日 10:33:00

秋水无恨 GBK Unicode UTF8 汉字 转换

php的汉字转换一直是比较麻烦的事

该类内置了四个过滤"&#[dec];","&#x[hex];","%u[hex]","utf8转换"
方便用户的使用,同时也可自定义过滤进行自己喜欢的操作


qswhU.php 从这里下载
http://www.blueidea.com/user/qswh/qswhU.zip

class qswhU{
 var $qswhData;
 function qswhU($filename="qswhU.php"){
  $this->qswhData=file($filename);
 }
 
 function decode($str,$pattern=0){
  $arr=array("/&#(/w+);/iU","/((%/w/w)+)/i","/%u(/w{4,5})/iU");
  if(is_integer($pattern)){
    if($pattern>=count($arr))die("Invalid Function");
    $pattern=$arr[$pattern];
  }
  return preg_replace_callback($pattern,array($this,"u2gb"),$str);
 }
 
 function u2gb($arr){
  /******(qiushuiwuhen 2002-8-15)******/
  $ret="";$str=$arr[1];
  if(preg_match_all("/%/w{2}/",$str,$matches)){
   for($i=0;$i<count($matches[0]);$i++){
    $chr1=hexdec(substr($matches[0][$i],1));
    $arr=array("f0","e0","c0","0");
    for($j=0;$j<count($arr);$j++)if($chr1>hexdec($arr[$j]))break;
    $chr=hexdec(substr($matches[0][$i],1))-hexdec($arr[$j]);
    while(++$j<count($arr))$chr=$chr*0x40+(hexdec(substr($matches[0][++$i],1))-0x80);
    $str=dechex($chr);
    if(strlen($str)==4){
     $p=hexdec(substr($str,0,2))-0x4d;
     $q=hexdec(substr($str,2))*4;
     $ret.=chr(hexdec(substr($this->qswhData[$p],$q,2)));
     $ret.=chr(hexdec(substr($this->qswhData[$p],$q+2,2)));
    }else
     $ret.=chr(hexdec($str));
   }
  }
  else{ 
   if(strtolower($str[0])=="x")
    $str=substr($str,1);
   else
    if(strlen($str)!=4)$str=dechex($str);
    
   if(strlen($str)==4){
    $p=hexdec(substr($str,0,2))-0x4d;
    $q=hexdec(substr($str,2))*4;
    $ret.=chr(hexdec(substr($this->qswhData[$p],$q,2)));
    $ret.=chr(hexdec(substr($this->qswhData[$p],$q+2,2)));
   }else
    $ret.=chr(hexdec($str));
  }
  return $ret;
 }
 
 


使用范例

$qswh=new qswhU("qswhU.php");//如果文件名是qswhU.php,可省参数
echo "<xmp>不带参数(默认过滤为:&#[num];):";
echo "/n".$qswh->decode("&#x4E2D;&#x6587;&#x41;&#x62;&#x63;");
echo "/n".$qswh->decode("&#20013;&#25991;&#65;&#98;&#99;");
echo "/n调用内置过滤(UTF转码):".$qswh->decode("%E4%B8%AD%E6%96%87%20!%22%23%24%25%26'()*%2B%2C%2F%3A%3B%3C%3D%3E%3F%40%5B%5D%5E%60%7B%7C%7D~%25Abc",1);
echo "/n调用内置过滤unescape(%u[num]):".$qswh->decode("%u4E2D%u6587Abc",2);
echo "/n自定义过滤([x+num]):".$qswh->decode("[x4E2D][x6587][x41][x62][x63]","//[(/w+)/]/");

效果如下:
不带参数(默认过滤为:&#[num];):
中文Abc
中文Abc
调用内置过滤(UTF转码):中文 !"#$%&'()*+,/:;<=>?@[]^`{|}~%Abc
调用内置过滤unescape(%u[num]):中文Abc
自定义过滤([x+num]):中文Abc


ps.该文章现仅限在csdn文档中心,如要转载,请和作者联系,否则后果自负。

PHP 中文 转UNICODE, JS 将UNICODE转为GBK

首先是PHP下的中文转为UNICODE进行传递 function str_utf8_unicode($name){ $name = iconv('GBK','UCS-2'...
  • xocom
  • xocom
  • 2016年08月11日 17:09
  • 1041

UNICODE, GBK, UTF-8编码的转换

>                 Tags: encoding,c 1. 基础 1.1 ASCII码 我们知道, 在计算机内部, 所有的信息最终都表示为一个二进制的字符串. 每一个二进制 位(...
  • hui523hui523hui523
  • hui523hui523hui523
  • 2015年10月15日 09:59
  • 6401

Unicode,UTF-8,UTF-16,UTF-32,gb2312,gbk区别

1.ascII码。 0x0*******; 总共127个。 有英文字母和符号。 好吧,问题来了。英文够用了,其他不够用啊。于是用两种方法解决:  a)GB2312 GBK 这一类的编码方...
  • u010276189
  • u010276189
  • 2015年11月21日 15:55
  • 1844

PHP编码转换函数 自动转换字符集支持数组转换

// 自动转换字符集 支持数组转换 function auto_charset($fContents, $from='gbk', $to='utf-8') { $from = strtoupper($...
  • amqvje
  • amqvje
  • 2015年04月17日 17:32
  • 599

Python编码UNICODE GBK UTF-8字符集转换的正确姿势

规范 脚本文件编码 由于需要经常性使用到中文字符,因此Python脚本新建后,请在头部添加代码: # coding: utf-8或者为pycharm设置代码模版,这样每次新建Python文件时会自动...
  • asmcvc
  • asmcvc
  • 2017年02月20日 18:36
  • 8281

UNICODE GBK UTF-8 编码互转(VC++)

1:UNICODE和GBK互转 wstring MBytesToWString(const char *lpcszString) { int len = strlen(lpcszString); ...
  • sunflover454
  • sunflover454
  • 2015年12月30日 18:15
  • 2288

python编码转换__&__UNICODE,GBK,UTF-8区别

转载自:http://blog.csdn.net/uestcyao/article/details/7914935 python编码转换 python 编码转换 主要介绍了python的编码机...
  • leoking01
  • leoking01
  • 2015年01月26日 14:27
  • 3861

Perl中文/unicode/utf8/GB2312之间的转换

本文转载自:
  • chivalrousli
  • chivalrousli
  • 2014年10月23日 17:04
  • 2201

libIconv库实现中文中字符串与GBK、Unicode、UTF-8三种编码互转

libIconv库实现GBK、Unicode、UTF-8三种编码互转比window api更为简单,而且libIconv库跨平台。 IibIconv库在windows下的编译参照windows下使用V...
  • bladeandmaster88
  • bladeandmaster88
  • 2017年02月01日 23:32
  • 2721

linux和windows下 unicode、GBK、utf-8 互相转化

一,关于编码基础知识                 A。GBK: 二,关于字符串转换   三,关于文件存储    ...
  • dobest9014
  • dobest9014
  • 2011年04月25日 19:30
  • 2197
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:php的汉字转换: Unicode(UTF8)->GBK
举报原因:
原因补充:

(最多只允许输入30个字)