用php实现gb2312和unicode间的编码转换

转载 2006年06月11日 06:05:00

gb2312 和 unicode 间的编码转换

下面的例子是将 gb2312 转换为 "全"这种形式

php4.3.1以后的iconv函数很好用的,只是需要自己写一个uft8到unicode的转换函数。
查表(gb2312.txt)也行
<?
$text = "电子书库";
preg_match_all("/[/x80-/xff]?./",$text,$ar);
foreach($ar[0] as $v)
  echo "&#".utf8_unicode(iconv("GB2312","UTF-8",$v)).";";
?>
<?
// utf8 -> unicode
function utf8_unicode($c) {
  switch(strlen($c)) {
    case 1:
      return ord($c);
    case 2:
      $n = (ord($c[0]) & 0x3f) << 6;
      $n += ord($c[1]) & 0x3f;
      return $n;
    case 3:
      $n = (ord($c[0]) & 0x1f) << 12;
      $n += (ord($c[1]) & 0x3f) << 6;
      $n += ord($c[2]) & 0x3f;
      return $n;
    case 4:
      $n = (ord($c[0]) & 0x0f) << 18;
      $n += (ord($c[1]) & 0x3f) << 12;
      $n += (ord($c[2]) & 0x3f) << 6;
      $n += ord($c[3]) & 0x3f;
      return $n;
  }
}
?>

下面的例子是利用php将"&#20840;"这种编码转换为gb2312.
<?php
$str = "TTL&#20840;&#22825;&#20505;&#33258;&#21160;&#32858;&#28966;";
$str = preg_replace("|&#([0-9]{1,5});|", "/".u2utf82gb(//1)./"", $str);
$str = "/$str=/"$str/";";

eval($str);
echo $str;

function u2utf82gb($c){
    $str="";
    if ($c < 0x80) {
         $str.=$c;
    } else if ($c < 0x800) {
         $str.=chr(0xC0 | $c>>6);
         $str.=chr(0x80 | $c & 0x3F);
    } else if ($c < 0x10000) {
         $str.=chr(0xE0 | $c>>12);
         $str.=chr(0x80 | $c>>6 & 0x3F);
         $str.=chr(0x80 | $c & 0x3F);
    } else if ($c < 0x200000) {
         $str.=chr(0xF0 | $c>>18);
         $str.=chr(0x80 | $c>>12 & 0x3F);
         $str.=chr(0x80 | $c>>6 & 0x3F);
         $str.=chr(0x80 | $c & 0x3F);
    }
    return iconv('UTF-8', 'GB2312', $str);
}
?>

或者是:

<?php
function unescape($str) {
  $str = rawurldecode($str);
  preg_match_all("/(?:%u.{4})|&#x.{4};|&#/d+;|.+/U",$str,$r);
  $ar = $r[0];
//print_r($ar);
  foreach($ar as $k=>$v) {
    if(substr($v,0,2) == "%u")
      $ar[$k] = iconv("UCS-2","GB2312",pack("H4",substr($v,-4)));
    elseif(substr($v,0,3) == "&#x")
      $ar[$k] = iconv("UCS-2","GB2312",pack("H4",substr($v,3,-1)));
    elseif(substr($v,0,2) == "&#") {
//echo substr($v,2,-1)."<br>";
      $ar[$k] = iconv("UCS-2","GB2312",pack("n",substr($v,2,-1)));
    }
  }
  return join("",$ar);
}

$str = "TTL&#20840;&#22825;&#20505;&#33258;&#21160;&#32858;&#28966;";
echo unescape($str); //out TTL全天候自动聚焦
?>

 

 

 

利用javascript来转换

<style>
BODY {
 FONT-SIZE: 9pt; PADDING-RIGHT: 0px; PADDING-LEFT: 0px; PADDING-BOTTOM: 0px; PADDING-TOP: 0px;
}
input {
 FONT-SIZE: 9pt; height: 13pt;
}
</style>

<script language="JavaScript1.2">
/*
 This following code are designed and writen by Windy_sk <seasonx@163.net>
 You can use it freely, but u must held all the copyright items!
*/

function Str2Unicode(str){
 var arr = new Array();
 for(var i=0;i<str.length;i++){
  arr[i]="&#" + str.charCodeAt(i) + ";";
 }
 return(arr.toString().replace(/,/g,""));
}

function Unicode2oStr(str){
 var re=/&#[/da-fA-F]{1,5};/ig;
 var arr=str.match(re);
 if(arr==null)return("");
 for(var i=0;i<arr.length;i++){
  arr[i]=String.fromCharCode(arr[i].replace(/[&#;]/g,""));
 }
 return(arr.toString().replace(/,/g,""))
}

function modi_str(){
 if(document.all.text.method.checked){
  if(document.all.text.decode.value!=""){
   document.all.text.encode.value = Str2Unicode(document.all.text.decode.value);
  }else{
   document.all.text.decode.value = Unicode2oStr(document.all.text.encode.value);
  }
 }else{
  if(document.all.text.encode.value!=""){
   document.all.text.decode.value = Unicode2oStr(document.all.text.encode.value);
  }else{
   document.all.text.encode.value = Str2Unicode(document.all.text.decode.value);
  }
 }
}
</script>
<title>Unicode</title>
<form name=text>
文本原型:<br>
  <textarea name="decode" cols="100" rows="10"></textarea>
  <br>
转换代码:<br>
  <textarea name="encode" cols="100" rows="10"></textarea>
  <br>
  <input type="checkbox" name="method" checked> 正向转换
  <input type=button onclick="modi_str()" value=" 确 定 ">
  <input type=reset value=" 清 空 ">
  <input type=button onclick="document.all.text.method.checked?document.all.text.encode.select():document.all.text.decode.select()" value=" 全 选 ">
</form>


下面是一个显示所有全角半角的字体的查看例子

<style>
BODY {
 FONT-SIZE: 9pt; PADDING-RIGHT: 0px; PADDING-LEFT: 0px; PADDING-BOTTOM: 0px; PADDING-TOP: 0px;
}
input {
 FONT-SIZE: 9pt; height: 13pt;
}
</style>
<script>
function showUni(min,max){
 show.document.open();
 show.document.writeln("<style>body{font-size:9pt;word-break:break-all;}</style>");
 show.document.writeln(min + " - " + max + "<br><br>");
 var i=0;
 for(i=min;i<=max;i++){
  show.document.write("&#" + i + ";");
 }
 show.document.close();
}
</script>
<input type=button value="半角"  onclick=showUni(32,126)>
<input type=button value="全角"  onclick=showUni(65281,65374)>
<input type=button value="中文1" onclick=showUni(19968,40869)>
<input type=button value="中文2" onclick=showUni(63744,64045)>
<input type=button value="日文平"  onclick=showUni(12353,12435)>
<input type=button value="日文片"  onclick=showUni(12449,12534)>
<input type=button value="韩文"  onclick=showUni(44032,55203)>
<br>自定义:<input name=min> - <input name=max>
<input type=button value="察看" onclick=showUni(parseInt(document.all.min.value),parseInt(document.all.max.value))>
<br>
<iframe src="about:blank" id=show width=100% height=70% scroll=no></iframe>

浅谈unicode和gb2312之间的转换

浅谈unicode和gb2312之间的转换     我先说,这两个是没有线性的转换关系,不能通过程序加加减减弄出来,只能硬性的对应,今天看了一天,终于知道了,哎。。。 1. Unicode概念    ...
  • jiaowodiedie
  • jiaowodiedie
  • 2010年03月21日 00:23
  • 2642

VC中实现GB2312、BIG5、Unicode编码转换

一、文件编码格式转换 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 //GB2312 编码文件转换成 Unic...
  • u012218838
  • u012218838
  • 2017年10月27日 17:15
  • 127

用php实现 gb2312 和 unicode 间的编码转换

gb2312 和 unicode 间的编码转换下面的例子是将 gb2312 转换为 "全"这种形式php4.3.1以后的iconv函数很好用的,只是需要自己写一个uft8到unicode...
  • hahawen
  • hahawen
  • 2005年03月05日 01:45
  • 2041

用php实现gb2312和unicode间的编码转换

gb2312 和 unicode 间的编码转换转自:动态网站制作指南 | www.knowsky.com 下面的例子是将 gb2312 转换为 "全"这种形式php4.3.1以后的ico...
  • riyao
  • riyao
  • 2007年10月30日 09:05
  • 569

C++转换unicode utf-8 gb2312编码

windows开发环境下用VC++6.0 对unicode 、utf-8、 gb2312 三种编码格式之间的转换方法: #include #include #include using nam...
  • guzicheng
  • guzicheng
  • 2012年06月08日 14:44
  • 3302

gb2312 和 unicode (UTF-8)间的编码转换

gb2312 和 unicode (UTF-8)间的编码转换下面的例子是将 gb2312 转换为 "全"这种形式下面的例子是将 gb2312 转换为 "全"这种形式php4...
  • book_coolboy_cl
  • book_coolboy_cl
  • 2006年10月20日 16:41
  • 689

js GB2312和unicode互转

var GB2312UnicodeConverter = {     ToUnicode: function (str) {         return escape(str).toLocaleLo...
  • sinolzeng
  • sinolzeng
  • 2015年01月24日 14:16
  • 527

ACSII,GB2312,GBK,GB18030,Unicode,UTF8,UTF16,UTF32,BOM区别与转换——字符编码最全总结

本人总结的最全字符编码概述,分享学习,涉及ACSII,GB2312,GBK,GB18030,Unicode,UTF8,UTF16,UTF32,BOM。 在做总结时被问到字符编码的知识,由于这块知识没...
  • yingmeng9913
  • yingmeng9913
  • 2015年09月29日 14:51
  • 1082

php 实现 从unicode到gb2312的转换

php 实现 从unicode到gb2312的转换,代码如下$a="/u53D1/u8868/u8BC4/u8BBA/uFF1A";echo unicode2gb2312($a);//将/uXXXX/...
  • ywchen2000
  • ywchen2000
  • 2007年10月26日 11:19
  • 873

php度取excel内容 并对其unicode编码转化成gb2312

------------------------------------------Excel 类    V1.1                By Monkey------------------...
  • keyunq
  • keyunq
  • 2007年01月23日 16:59
  • 1706
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:用php实现gb2312和unicode间的编码转换
举报原因:
原因补充:

(最多只允许输入30个字)