htmlentities、urlencode、escape、encodeURI辨析

对HTML中各种编码有点不清晰,于是找了一些资料,方便理解。

  1. php中“htmlentities”、“htmlspecialchars”等html相关编码函数,主要的目的是将在HTML语言中有特殊用途的字符或不可见字符(空格默认最多只会连续输出一个),如“<”、“>”、“空格”等以html编码进行转换,以便在页面中输出这些字符。
  2. javascript中“escape”、“unescape”函数采用ISO Latin字符集对指定字符串进行编码。所有的空格符、标点符号、特殊字符以及其他非ASCII字符都将被转化成%xx格式的字符编码(xx等于该字符在字符集表里面的编码的16进制数字)。比如,空格符对应的编码是%20。unescape方法与此相反。不会被此方法编码的字符: @ * / +
  3. javascript中“encodeURI”、“decodeURI”将指定字符串采用UTF-8编码格式转化成escape格式的字符串(或把escape格式的字符串转化为UTF-8编码)。不会被此方法编码的字符:! @ # $& * ( ) = : / ; ? + '
  4. javascript中“encodeURIComponent”函数把URI字符串采用UTF-8编码格式转化成escape格式的字符串。与encodeURI()相比,这个方法将对更多的字符进行编码,比如 / :?;等字符,不会被此方法编码的字符:! * ( ) 。所以encodeURIComponent可以用于下面这种情况,某URL http://www.baidu.com?url=XXXX,其中XXXX也是一个链接,这时应该用encodeURIComponent对XXXX编码
  5. php中“urlencode”、“urldecode”、“rawurlencode”、“rawurldecode”函数基本上等效于javascript中encodeURI系列函数,区别只是部分特殊字符是否进行编码的问题
  6. 对于中文字符串来说,如果不希望把字符串编码格式转化成UTF-8格式的(比如原页面和目标页面的charset是一致的时候),只需要使用escape。如果你的页面是GB2312或者其他的编码,而接受参数的页面是UTF-8编码的,就要采用encodeURI或者encodeURIComponent。
关于XSS攻击
  1. 将变量输出到javascript中,如“<script>”标签中等需要对变量使用引号包裹并进行javascript级别的编码,如escape
  2. 将变量输出到HTML中,如“innerHTML”,直接输出等,需要对变量进行HTML编码,如php的htmlentities
  3. 将变量先输出到javascript中再使用javascript将组合后的变量输出到HTML中,要在输出到javascript时使用javascript编码,并在输出到HTML中时使用HTML编码

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值