今天遇到了一个网页时繁体的,它的title和meta信息在浏览器中显示正常,但是查看其源码是却是“万博彩”这种。
网上找了资料后,得知,网页中&#开头的是HTML实体,一些字符在 HTML 中是预留的,拥有特殊的含义,HTML实体对照表:HTML ASCII 参考手册
那么问题来了
中文汉字是转如何换成HTML实体的呢?
其实很简单,汉字的HTML实体由三部分组成,”&#+ASCII+;“ 即可。
例如,把“欢迎点赞收藏” 转换成“欢迎点赞收藏”
下面是php实现过程,喜欢的朋友可以点赞收藏哦
/**
* 将ascii码转为字符串
* @param $str 要解码的字符串
* @param $prefix 前缀,默认:&#
* @return string
*/
function ascii_decode($str, $prefix="&#") {
$string = '';
$str = str_replace($prefix, "", $str);
$strArr = explode(";", $str);
foreach ($strArr as $dec) {
if ($dec < 128) {
$string .= chr($dec);
} else if ($dec < 2048) {
$string .= chr(192 + (($dec - ($dec % 64)) / 64));
$string .= chr(128 + ($dec % 64));
} else {
$string .= chr(224 + (($dec - ($dec % 4096)) / 4096));
$string .= chr(128 + ((($dec % 4096) - ($dec % 64)) / 64));
$string .= chr(128 + ($dec % 64));
}
}
return $string;
}
/**
* 将字符串转换为ascii码
* @param $str 要编码的字符串
* @param string $prefix 前缀,默认:&#
* @return string
*/
function ascii_encode($str, $prefix = "&#") {
$ascii = '';
$len = strlen($str);
$a = 0;
while ($a < $len) {
$ud = 0;
if (ord($str[$a]) >= 0 && ord($str[$a]) <= 127) {
$ud = ord($str[$a]);
$a += 1;
} else if (ord($str[$a]) >= 192 && ord($str[$a]) <= 223) {
$ud = (ord($str[$a]) - 192) * 64 + (ord($str[$a + 1]) - 128);
$a += 2;
} else if (ord($str[$a]) >= 224 && ord($str[$a]) <= 239) {
$ud = (ord($str[$a]) - 224) * 4096 + (ord($str[$a + 1]) - 128) * 64 + (ord($str[$a + 2]) - 128);
$a += 3;
} else if (ord($str[$a]) >= 240 && ord($str[$a]) <= 247) {
$ud = (ord($str[$a]) - 240) * 262144 + (ord($str[$a + 1]) - 128) * 4096 + (ord($str[$a + 2]) - 128) * 64 + (ord($str[$a + 3]) - 128);
$a += 4;
} else if (ord($str[$a]) >= 248 && ord($str[$a]) <= 251) {
$ud = (ord($str[$a]) - 248) * 16777216 + (ord($str[$a + 1]) - 128) * 262144 + (ord($str[$a + 2]) - 128) * 4096 + (ord($str[$a + 3]) - 128) * 64 + (ord($str[$a + 4]) - 128);
$a += 5;
} else if (ord($str[$a]) >= 252 && ord($str[$a]) <= 253) {
$ud = (ord($str[$a]) - 252) * 1073741824 + (ord($str[$a + 1]) - 128) * 16777216 + (ord($str[$a + 2]) - 128) * 262144 + (ord($str[$a + 3]) - 128) * 4096 + (ord($str[$a + 4]) - 128) * 64 + (ord($str[$a + 5]) - 128);
$a += 6;
} else if (ord($str[$a]) >= 254 && ord($str[$a]) <= 255) {
$ud = false;
}
$ascii .= $prefix . $ud . ";";
}
return $ascii;
}