今天程序出了个BUG,仔细一看是字符编码的问题:
$ret = substr($full_spell, 0 ,1);
上面的data本来是英文的,自然是没有问题,但是数据库不知道为什么出现了中文,这下好了,一个utf-8编码的中文占据3个字符,这截取一个,额,乱码了。
以后呢,字符截取用这个,就算出现中文也可以正常处理了
$ret= mb_substr($full_spell, 0 ,1, 'utf-8');
有关字符编码平时处理的时候其实出现过很多次的BUG了,以后慢慢整理出一份文档。下面是一份支持数组和字符串转码的函数
/**
* @brief 编码转码支持数组
* @author water
* @param (string/array) $fContents 支持输入数组
* @param string $from 从神马字符编码
* @param string $to 转化为神马字符编码
* @return (string/array) $fContents 支持返回数组
* @example /path/to/example
*/
public static function convertEncoding($fContents, $from = 'gbk', $to = 'utf-8') {
$from = strtoupper($from) == 'UTF8' ? 'utf-8' : $from;
$to = strtoupper($to) == 'UTF8' ? 'utf-8' : $to;
if (strtoupper($from) === strtoupper($to) || empty($fContents) || (is_scalar($fContents) && !is_string($fContents))) {
//如果编码相同或者非字符串标量则不转换
return $fContents;
}
if (is_string($fContents)) {
if (function_exists('mb_convert_encoding')) {
return mb_convert_encoding($fContents, $to, $from);
} elseif (function_exists('iconv')) {
return iconv($from, $to, $fContents);
} else {
return $fContents;
}
} elseif (is_array($fContents)) {
foreach ($fContents as $key => $val) {
$_key = Util::convertEncoding($key, $from, $to);
$fContents[$_key] = Util::convertEncoding($val, $from, $to);
if ($key != $_key)
unset($fContents[$key]);
}
return $fContents;
}
else {
return $fContents;
}
}