HTML,Unicode与NCR(数字字符引用)
标签: html, NCR, Numeric Character Reference, Unicode
标题: HTML,Unicode与NCR(数字字符引用)
作者: Demon
链接: http://demon.tw/programming/numeric-character-reference.html
版权: 本博客的所有文章,都遵守“署名-非商业性使用-相同方式共享 2.5 中国大陆”协议条款。
昨天ihipop问的一个问题,下面是什么编码?
telecomadmin+8位数字
根据常识判断,&#后面的数字应该是Unicode编码值,写个VBS验证:
MsgBox ChrW(20301)&ChrW(25968)&ChrW(23383)
输出“位数字”,连起来就是“telecomadmin+8位数字”,读起来挺通顺的,看来是Unicode没错了。
Google了一下,这东西专业名称叫numeric character reference(NCR),直译就是数字字符引用。一个Numeric Character Reference编码是由一个与号(&)跟着一个井号(#),然后跟着这个字符的Unicode编码值,最后跟着一个分号组成的,就像上面的例子一样。
有了数字字符引用,就可以在网页中显示Unicode字符了,不用考虑html文件本身的编码,因为数字字符引用只用到ASCII字符集里的字符。所以,即使在gb2312编码的网页中,也可以用NCR显示埃及的象形文字了。