默认情况下,php使用Latin1字符集来生成HTML文档。但是如果字符串是按utf-8编码的则会出现问题:
1. strlen() 返回的是字节数而不是字符数。
2.字符的大小写转换可能出现问题
3.字符串排序可能不正确
4.stripsplashes(),substr(), split()会出现问题
解决方案: php提供的utf8_encode()和utf8_decode()函数可以完成utf8和Latin1之间的转换
另外,如果php在编译时带有iconv扩展模块(unix\linux)或者扩展模块被启用(windows:php.ini中加上extension=php_iconv.dll);
就可以使用iconv_xxx()函数。
mbstring扩展模块页提供了更多的辅助数组
大多数浏览器根据HTTP协议里的字符集设置信息而忽略<meta>标签。
HTTP首部的文档类型和字符集信息来源如下(按优先级排序)
1.header('Content-Type:text/html;charset=''');
2,php.ini默认设置
3.Apache Web目录中的.htaccess文件
4.apache 默认配置http.conf
mysql 与Unicode
mysql数据表中的字符集在create命令创建他们时就确定了
set namespace utf8告诉mysql,随后的SQL语句采用的是utf8编码,
set names只对mysql与php之间的通信有影响。如果字符串中有新字符集中无法表示的字符,将会用问号替代。