今日在重构代码,在弄phpexcel下载文档的时候发现了一个问题,因为需要通过条件判断来获取对应数据进行下载,下载是通过一个a标签进行的,为了方便通过url传参,在过程中发现传递的中文下载没有得到对应的表格,仔细排查发现中文乱码,在网上找了很多解决方案,都说使用 iconv("gbk","utf-8",$name) 来进行转换或者mb_convert_encoding($name, "utf-8", "gbk");
但是测试了半天没有一点反应,然后我使用:
$encode = mb_detect_encoding($_REQUEST['name'], array('UTF-8',"ASCII","GB2312","GBK",'BIG5'));
判断获取的字符串的类型,没想到返回‘UTF-8’,这时我已经很郁闷快要放弃了,后来我仔细研究了一下这个乱码,发现它是
"%E5%BC%A0%E9%9B%B7"18位的,我的中文是两位,在utf8编码下应该占6个字节,所以我有有了疑问,后来我又想到url编码urlencode与urldecode两个函数的使用,想到就行动,一经测试果然是这个url编码的问题。 下来讲解一下原因吧: 在因特网上传送URL,只能采用ASCII字符: 也就是说URL只能使用英文字母、阿拉伯数字和某些标点符号,不能使用其他文字和符号,即 只有字母和数字 [0-9a-zA-Z] 、一些特殊符号 $-_.+!*'() [不包括双引号]、以及某些保留字(空格转换为 +),才可以不经过编码直接用于URL; 这意味着 如果URL中有汉字,就必须编码后使用。 但是麻烦的是 标准的国际组织并没有规定具体的编码方法,而是交给应用程序(浏览器)自己决定。 这导致"URL编码"成为了一个混乱的领域。
如果包含中文,其实会自动编码的,比如Chrome和火狐,而这两个浏览器也是开发者最常用到的所以他会自动编码。
希望这篇文章能帮到和我一样遇到这样问题的朋友!