楼主上周项目遇到一个小问题,具体是这样,因项目需求 我需要上传本地图片到服务器,图片命名方式要求含有中文(用于检索),然后后台提供接口给前端,前端来把照片展示出来,当图片不含中文时,一切正常,当图片含有中文,前端那边就会报404.
周一上午研究了一下 找到了原因及解决办法
浏览器会自动对中文进行URL编码
我意识到是不是 URL编码有问题导致,我试着 用 java api进行URL编码
我发现URL的值果然不同,因为我的java默认的是GBK编码格式,这里说说一下 UTF-8与GBK最大的区别
常用中文字符用utf-8编码占用3个字节(大约2万多字),但超大字符集中的更大多数汉字要占4个字节,GBK 收编的汉字两个字节一个汉字,
URL编码 是对每个字节 转换为16进制 前面再添加为%,
比如 “朗山路朗山三东” 共7个汉字
如果用UTF-8的格式去URL 编码的话,一个汉字3个字节应该一共是21个字节 也就是
%E6%9C%97%E5%B1%B1%E8%B7%AF%E6%9C%97%E5%B1%B1%E4%B8%89%E4%B8%9C
“朗”转换为16进制也就是 E6 9C 97
如果用GBK的格式去URL编码的话,一个汉字对应2个字节,7个汉字对应应该是14个字节,也就是
%C0%CA%C9%BD%C2%B7%C0%CA%C9%BD%C8%FD%B6%AB
“朗”转换为16进制也就是 C0 CA
服务器上文件名 是为gbk格式的,所以前端用utf-8 格式的路径去访问 会报404,
我有尝试把服务器上文件名改为utf-8格式的,再去访问,确认可行。
推荐一个编辑器
UltraEdit 可以直接看到汉字对应 16进制
参考 https://wenku.baidu.com/view/0c9939405a8102d277a22f77.html