最近在整cookie的时候遇到字符编码,感觉有些概念还不是很清晰,于是旁征博引一番,用以备忘!
这三兄弟的工作就是对字符串进行编码。相应的解码函数是unescape,decodeURI,decodeURIComponent
我们先看看escape:
该方法不会对 ASCII 字母和数字进行编码,也不会对下面这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。其他所有的字符都会被转义序列替换。
但是,遗憾的是,escape在处理更多更复杂的字符(如 UTF-8字符库)的时候,却无能为力,ECMAScript v3则建议使用 decodeURI 和 decodeURIComponent 替代它。
而encodeURI以及encodeURIComponent,也因大同小异被用到不同的环境中。
encodeURI:
encodeURI() 函数可把字符串作为 URI 进行编码。其返回值是URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。
该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。该方法的目的是对 URI 进行完整的编码,因此对以下在 URI 中具有特殊含义的 ASCII 标点符号,encodeURI() 函数是不会进行转义的:;/?:@&=+$,#
提示:如果 URI 组件中含有分隔符,比如 ? 和 #,则应当使用 encodeURIComponent() 方法分别对各组件进行编码。
通常encodeURI用在url跳转,这样就可以进行url整体编码,如:
location.href = encodeURI("http://www.cnblogs.com/s?word=博客园&ct=71104");
再来看看,encodeURIComponent
encodeURIComponent() 函数可把字符串作为 URI 组件进行编码。返回值是URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。
该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。其他字符(比如 :;/?:@&=+$,# 这些用于分隔 URI 组件的标点符号),都是由一个或多个十六进制的转义序列替换的。
提示:请注意 encodeURIComponent() 函数 与 encodeURI() 函数的区别之处,前者假定它的参数是 URI 的一部分(比如协议、主机名、路径或查询字符串)。因此 encodeURIComponent() 函数将转义用于分隔 URI 各个部分的标点符号。
根据上面描述的特点,encodeURIComponent适合用在url组装,cookie设置等一些需要针对某些变量、字符进行编码的场合。
document.cookie = [ encodeURIComponent(name), '=', options.encodevalue ? encodeURIComponent(value) : value, options.expireday ? '; expires=' + date.toGMTString() : '', options.path ? ';path=' + options.path : ';path=/', options.domain ? ';domain=' + options.domain : '', options.secure ? ';secure' : '' ].join('')