php utf8字节流,php UTF8 编码翻译

今天的任务是在 drupal_set_error里检测加入不符合条件的字符的UTF8信息。

先用了iconv()

然后 mb系列。

这里值得一提的是,这两个函数都是转码用的 并不能得到编码

然后utf decode 这个更坑爹。也是转码用的。。。

无奈自己写了个

$utf8 = ord($value{0});

$hex = '0x' . dechex($utf8);

if ($utf8 > 192) {

$hex .= ' 0x' . dechex(ord($value{1}));

}

if ($utf8 > 224) {

$hex .= ' 0x' . dechex(ord($value{2}));

}

if ($utf8 > 240) {

$hex .= ' 0x' . dechex(ord($value{1}));

}

if ($utf8 > 248) {

$hex .= ' 0x' . dechex(ord($value{4}));

}

elseif ($utf8 > 252) {

$hex .= ' 0x' . dechex(ord($value{5}));

}

解释一下

utf8 的官方资料这样说的:

Unicode和UTF-8之間的轉换關係表

UTF-8字节流

U+00000000 – U+0000007F

0xxxxxxx

U+00000080 – U+000007FF

110xxxxx 10xxxxxx

U+00000800 – U+0000FFFF

1110xxxx 10xxxxxx 10xxxxxx

U+00010000 – U+001FFFFF

11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

U+00200000 – U+03FFFFFF

111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

U+04000000 – U+7FFFFFFF

1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

小伙伴们可以看到,UTF8 是根据取第一个八位二进制的数值决定后面的编码的。那么,ord函数,我们就取了字符的第一个八位二进制编码的十进制版本。于是乎就算出一下这些数值的函数便好了:

00000000 0

11000000 192

11100000 224

11110000 240

11111000 248

11111100 252

当大于这一数值时,我们可以认为后面0占位的地方有1出现,那么 后面的区段必须有数值,这样,在$hex后面加入区段即可。

今天比较简单,php。据说讲解php容易被误认为拍簧片。。好吧。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值