mb_detect_encoding()函数是用于检测得定字符串的编码的,当我们使用这个函数检测中文时有时候会出现误报的现象, 如检测出为utf-8,但是他实际是gb2312. 为此我们按如下做法得到准确结果
$encoding = array('UTF-8', 'ASCII', 'GB2312', 'GBK');
//$encoding参数的作用是指示mb_detect_encoding从该数组中按顺序找,看是否有匹配
//平时我使用时没有加第二个参数,那么该函数会默认值, 而这些值是没包含'GB2312', 'GBK'的,
//所以就无法正确检测出中文字符的编码, 如果是检测中文的话此处的$encode包含值就够用了
$encode = mb_detect_encoding($str, $encoding);
//为gb2312时会返回EUC-CN , GBK时会返回CP936;
//返回的值名字不一样但实际他们都是指同一个东西, 叫法不一样罢了
echo $encode;
//如果我们想其他编码方式转到utf-8,那么可以使用如下简洁写法
$utf8_str = mb_convert_encoding($str, "UTF-8", mb_detect_encoding($str,$encoding)),