采集网页数据的时候遇到了中文显示为 "深入理解" 的问题,直接显示在网页上是正常的中文,但是转发给微信就是刚刚那些字段。心塞&卡顿了好久T_T,最后还是顺利解决。
这些 "深"格式的 就是NCR(Numberic character reference)。php可以用 mb_convert_encoding()这个函数来转换。
$str = mb_convert_encoding($str , "utf-8", 'HTML-ENTITIES');