一、获取字符串编码,这个也不是百分百准确,只是返回可能性最大的值。
string mb_detect_encoding ( string $str [, mixed $encoding_list = mb_detect_order() [, bool $strict = false ]] )
$str : 被检测的字符串,长度短的话错误率比较高
$encoding_list : 指定编码序列,如果这个参数被赋值,那么函数将从这个参数的值中返回最有可能的编码值。
$strict : 如果为true ,使用严格的编码检测,这样检测结果会更准确。
示例:
mb_detect_encoding($dics,array('GB2312','GBK','UTF-8','CP936'),true);
二、编码转换函数:
string iconv ( string $in_charset , string $out_charset , string $str )
string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
这两个函数都可以实现编码转换,区别是:
1、mb_convert_encoding() 该函数会根据内容自动识别编码,但是执行效率比iconv差;
2、然后有一种说法就是iconv()在一些字符转换下会不正常,网上有种说法就是:发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug.
3、mb_convert_encoding()是PHP扩展函数,要开启扩展库才能用;而iconv是PHP内置函数,不需另外开启扩展库就可以使用。
4、一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.
PS:网上摘抄,未经验证过
三、中文字符串截取
string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )
$encoding : 指定编码,如果没有则函数跟substr的效果是一样的
四、中文字符串查找指定字符串的位置
int mb_strpos ( string $haystack , string $needle [, int $offset = 0 [, string $encoding ]] )