我在JS中有一个简单的代码,如果涉及特殊字符,我无法在PHP中复制。
这是JS代码(请参阅JSFiddle输出):
var str = "t????↙️????"; //char "t" and special characters, emojis, etc.. document.write("Length is: "+str.length); // Length is: 19 for(var i=0; i<str.length; i++) { document.write("<br> charCodeAt(" + i + "): " + str.charCodeAt(i)); }
第一个问题是PHP strlen()
并且mb_strlen()
已经给出了JS的不同结果(strlen:39,mb_strlen:11),但是我设法使用自定义JS_StringLength
函数(由于这个 SO答案)。
这是我到目前为止在PHP中的内容(请参阅phpFiddle输出):
<?php function JS_StringLength($string) { return strlen(iconv('UTF-8', 'UTF-16LE', $string)) / 2; } function JS_charCodeAt($str, $index){ //not working! $char = mb_substr($str, $index, 1, 'UTF-8'); if (mb_check_encoding($char, 'UTF-8')) { $ret = mb_convert_encoding($char, 'UTF-32BE', 'UTF-8'); return hexdec(bin2hex($ret)); } else { return null; } } $str = "t????↙️????"; echo $str."\n"; //echo "Length is: ".strlen($str)."\n"; //wrong echo "Length is: ".JS_StringLength($str)."\n"; //OK for($i=0; $i<JS_StringLength($str); $i++) { echo "charCodeAt(".$i."): ".JS_charCodeAt($str, $i)."\n"; }
经过一整天的谷歌搜索,并 尝试 了 我发现的一切,没有任何东西给出与JS相同的结果。什么应该JS_charCodeAt
是获得相同输出的JS有类似的表现?
试验#1:将 我的字符串输入https://r12a.github.io/app-conversion/(很棒的东西)。看起来JS使用UTF-16代码单元(19)和PHP strlen
计算UTF-8代码单元(39)。
试验#2: 当json_encode()
我在我的字符串上使用时 - 当然 - 结果几乎就是这样,JavaScript可能会使用什么。我甚至检查了json_encode的原始PHP源代码以及json_encode如何转义字符串,但是......好吧..
转: https://cloud.tencent.com/developer/ask/191240/answer/298870
参考 : http://www.w3school.com.cn/jsref/jsref_charCodeAt.asp