PHP转码程序,PHP版汉字转码

最新推荐文章于 2022-10-26 08:37:43 发布

五石

最新推荐文章于 2022-10-26 08:37:43 发布

阅读量279

点赞数

文章标签： PHP转码程序

function unicode_encode($str, $encoding='GBK', $prefix='', $postfix=';'){

$str = iconv($encoding, 'UCS-2', $str);

$arrstr = str_split($str, 2);

$unistr = '';

for($i=0, $len=count($arrstr); $i

{

$dec = hexdec(bin2hex($arrstr[$i]));

$unistr .= $prefix.$dec.$postfix;

}

return $unistr;

}

$str = '哈哈';

$unistr = unicode_encode($str);

echo $unistr.'
';

?>

以上转自：http://blog.csdn.net/zalion/article/details/6239297

以下转自：http://hi.baidu.com/dmkj2008/item/9adbea82c3947e5927ebd958

汉字乱码一般用GB和UTF-8，如果用GB编码，网页用UTF-8，或相反，都会造成汉字无法正确显示

虽然php有模块可以转码，但mb_string的个头比较大，iconv比较适合

但iconv不能把汉字转成ascii的编码，类似ൟ这种。下面函数可以实现此功能：

mb_convert_encoding($string,'HTML-ENTITIES','UTF-8');

函数如下：

function uni2html($s) {

$len=strlen($s);

$rt='';

for($i=0;$i

if(ord($s[$i+2])) {

$rt.=''.(ord($s[$i+2])*256+ord($s[$i+3])).';';

} else $rt.=$s[$i+3];

}

return $rt;

}

例子：

$s='你好';

$a=iconv('UTF-8','UCS-4',$s);

echo uni2html($a);

运行结果：你好

原理：

中文先转成unicode编码，再计算unicode的序号。unicode编码是4个字节，32位定长，英文字母只占用后面的1个字节，中文占用后两个字节。中日韩文字的unicode编码范围4e00 - 9fa5，前两位补零。所以unicode是定长编码，而utf-8是变长编码，一个字符的长度1-3字节，英文字幕一个字节，中文三个字节

ascii 转汉字：

function u2utf8($c) { $str=""; if ($c >6); $str.=chr(0x80 | $c & 0x3F); } else if ($c >12); $str.=chr(0x80 | $c>>6 & 0x3F); $str.=chr(0x80 | $c & 0x3F); } else if ($c >18); $str.=chr(0x80 | $c>>12 & 0x3F); $str.=chr(0x80 | $c>>6 & 0x3F); $str.=chr(0x80 | $c & 0x3F); } return $str; } echo u2utf8('居');

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PHP转码程序,PHP版汉字转码

function unicode_encode($str, $encoding='GBK', $prefix='', $postfix=';'){$str = iconv($encoding, 'UCS-2', $str);$arrstr = str_split($str, 2);$unistr = '';for($i=0, $len=count($arrstr); $i{$dec = hexde...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。