在一个练习中,使用POST传递表单数据,$content=addslashes(htmlspecialchars($_POST["content"]));结果$content一直为空,开始以为是$_POST()有问题,在网上查了很久,最后才发现是htmlspecialchars()这个函数的问题:
提示:无法被识别的字符集将被忽略,并由 ISO-8859-1 代替。
htmlspecialchars() 函数把一些预定义的字符转换为 HTML 实体。语法为:
htmlspecialchars(string,quotestyle,character-set).
PHP 从 5.4.0 版本开始把htmlspecialchars() 函数的第三个参数字符串编码的默认值改成了 UTF-8,为了使 PHP 5.4 之前环境中编写的代码能够向前兼容,建议调用 htmlspecialchars 函数的的时候都提供字符串编码参数。比如说PHP代码中的中文编码正好是 GB2312 编码,那么就得htmlspecialchars(string, quotestyle ,'GB2312');
PHP 从 5.4.0 版本开始第三个参数字符串编码的默认值改成了 UTF-8,而我这段代码中的中文编码正好是 GB2312 编码的,跟现在的默认参数不一致,于是更改调用参数如下:
$content=addslashes(htmlspecialchars($_POST["content"],ENT_COMPAT ,'GB2312'));
这样,中文就可以正常显示。为了使 PHP 5.4 之前环境中编写的代码能够向前兼容,建议调用 htmlspecialchars 函数的的时候都提供字符串编码参数。
htmlspecialchars(string,quotestyle,character-set)
|
参数
|
描述
|
string
|
必需。规定要转换的
字符串。
|
quotestyle
|
可选。规定如何编码单引号和双引号。
|
ENT_COMPAT - 默认。仅
编码双引号。
| |
ENT_QUOTES - 编码双引号和单引号。
| |
ENT_NOQUOTES - 不编码任何引号。
| |
character-set
|
可选。字符串值,规定要使用的字符集。
|
ISO-8859-1 - 默认。
西欧。
| |
UTF-8 - ASCII 兼容多字节 8 比特 Unicode
| |
cp866 - DOS 专用 Cyrillic 字符集
| |
cp1251 - Windows 专用 Cyrillic 字符集
| |
cp1252 - Windows 专用西欧字符集
| |
KOI8-R - 俄语
| |
GB2312 - 简体中文,国家标准字符集
| |
BIG5 - 繁体中文
| |
BIG5-HKSCS - Big5 香港扩展
| |
Shift_JIS - 日语
| |
EUC-JP - 日语
|