以&#开头的是什么编码?php如何将字符串转成ASCII码

今天遇到了一个网页时繁体的,它的title和meta信息在浏览器中显示正常,但是查看其源码是却是“万博彩”这种。

网上找了资料后,得知,网页中&#开头的是HTML实体,一些字符在 HTML 中是预留的,拥有特殊的含义,HTML实体对照表:HTML ASCII 参考手册

那么问题来了

中文汉字是转如何换成HTML实体的呢?

其实很简单,汉字的HTML实体由三部分组成,”&#+ASCII+;“ 即可。

例如,把“欢迎点赞收藏” 转换成“欢迎点赞收藏”

下面是php实现过程,喜欢的朋友可以点赞收藏哦

/**
 * 将ascii码转为字符串
 * @param  $str 要解码的字符串
 * @param  $prefix 前缀,默认:&#
 * @return string
 */
function ascii_decode($str, $prefix="&#") {
	$string = '';
	$str = str_replace($prefix, "", $str);
	$strArr = explode(";", $str);
	foreach ($strArr as $dec) {
		if ($dec < 128) {
			$string .= chr($dec);
		} else if ($dec < 2048) {
			$string .= chr(192 + (($dec - ($dec % 64)) / 64));
			$string .= chr(128 + ($dec % 64));
		} else {
			$string .= chr(224 + (($dec - ($dec % 4096)) / 4096));
			$string .= chr(128 + ((($dec % 4096) - ($dec % 64)) / 64));
			$string .= chr(128 + ($dec % 64));
		}
	}
	return $string;
}



/**
 * 将字符串转换为ascii码
 * @param $str 要编码的字符串
 * @param string $prefix 前缀,默认:&#
 * @return string
 */
function ascii_encode($str, $prefix = "&#") {
    $ascii = '';
    $len = strlen($str);
    $a = 0;
    while ($a < $len) {
        $ud = 0;
        if (ord($str[$a]) >= 0 && ord($str[$a]) <= 127) {
            $ud = ord($str[$a]);
            $a += 1;
        } else if (ord($str[$a]) >= 192 && ord($str[$a]) <= 223) {
            $ud = (ord($str[$a]) - 192) * 64 + (ord($str[$a + 1]) - 128);
            $a += 2;
        } else if (ord($str[$a]) >= 224 && ord($str[$a]) <= 239) {
            $ud = (ord($str[$a]) - 224) * 4096 + (ord($str[$a + 1]) - 128) * 64 + (ord($str[$a + 2]) - 128);
            $a += 3;
        } else if (ord($str[$a]) >= 240 && ord($str[$a]) <= 247) {
            $ud = (ord($str[$a]) - 240) * 262144 + (ord($str[$a + 1]) - 128) * 4096 + (ord($str[$a + 2]) - 128) * 64 + (ord($str[$a + 3]) - 128);
            $a += 4;
        } else if (ord($str[$a]) >= 248 && ord($str[$a]) <= 251) {
            $ud = (ord($str[$a]) - 248) * 16777216 + (ord($str[$a + 1]) - 128) * 262144 + (ord($str[$a + 2]) - 128) * 4096 + (ord($str[$a + 3]) - 128) * 64 + (ord($str[$a + 4]) - 128);
            $a += 5;
        } else if (ord($str[$a]) >= 252 && ord($str[$a]) <= 253) {
            $ud = (ord($str[$a]) - 252) * 1073741824 + (ord($str[$a + 1]) - 128) * 16777216 + (ord($str[$a + 2]) - 128) * 262144 + (ord($str[$a + 3]) - 128) * 4096 + (ord($str[$a + 4]) - 128) * 64 + (ord($str[$a + 5]) - 128);
            $a += 6;
        } else if (ord($str[$a]) >= 254 && ord($str[$a]) <= 255) {
            $ud = false;
        }
        
        $ascii .= $prefix . $ud . ";";
    }
    
    return $ascii;
}

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值