x开头的字符 java_&#x开头的是什么编码呢。浏览器可以解释它。如中国等同与中文"中国"?...

最新推荐文章于 2023-03-14 10:09:25 发布

七嘴八舌聊电竞

最新推荐文章于 2023-03-14 10:09:25 发布

阅读量738

点赞数

文章标签： x开头的字符 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32160507/article/details/114386753

版权

形如——

dddd;

hhhh;

name;

——的一串字符是 HTML、XML 等 SGML 类语言的转义序列(escape sequence)。它们不是「编码」。

以 HTML 为例，这三种转义序列都称作 character reference：

前两种是 numeric character reference(NCR)，数字取值为目标字符的 Unicode code point；以「」开头的后接十进制数字，以「」开头的后接十六进制数字。

后一种是 character entity reference，后接预先定义的 entity 名称，而 entity 声明了自身指代的字符。

从 HTML 4 开始，NCR 以 Unicode 为准，与文档编码无关。

「中国」二字分别是 Unicode 字符 U+4E2D 和 U+56FD，十六进制表示的 code point 数值「4E2D」和「56FD」就是十进制的「20013」和「22269」。所以——

中国

中国

——这两种 NCR 写法都会在显示时转换为「中国」二字。

NCR 可以用于转义任何 Unicode 字符，而 character entity reference 很受限，参见 HTML 4 和 HTML5 中已有定义的字符列表：

如题： HtmlEncoder，中文转换成开头的编码(及HTML特殊字符解码)

代码如下：

package test.com.gjob.services;

import java.io.IOException;

import java.io.Writer;

public class HtmlEncoder {

public static void main(String args[]){

System.out.println(HtmlEncoder.encode("你好"));

}

/***

}

http://demon.tw/programming/numeric-character-reference.html

版权: 本博客的所有文章，都遵守“署名-非商业性使用-相同方式共享 2.5 中国大陆”协议条款。

telecomadmin+8位数字

根据常识判断，后面的数字应该是Unicode编码值，写个VBS验证：

25968)&ChrW(23383)

numeric character reference(NCR)，直译就是数字字符引用。一个Numeric Character Reference编码是由一个与号(&)跟着一个井号(#)，然后跟着这个字符的Unicode编码值，最后跟着一个分号组成的，就像上面的例子一样。

这篇文章发布于 2011年04月9日，星期六，21:43，归类于程序设计。您可以跟踪这篇文章的评论通过 RSS 2.0feed。您可以留下评论，或者从您的站点trackback。

你是否在dreamweaver里编辑网页的时候看到Σ这样的东西，你曾使用过这样的玩意吧，或者你在调试webservice的时候看到返回xml字符串中现γ这样的怪物呢？你看不懂他们可能用浏览器或者DW预览一下都是可以看到庐山真面目的，它是谁？

从字面上观察，一个是用+16进制+; 表达信息，一个是用&+字符串+; 突然让我想起了汇编语言里头的助记符跟实际二进制指令代码，带着这个猜测往下看吧！

Character

entities references

Character

entity references，也就是通常我们说得 html实体字符，一些字符在 HTML 中拥有特殊的含义，比如小于号 (

字符实体有三部分：一个和号 (&)，一个实体名称，或者 # 和一个实体编号，以及一个分号 (;)。要在 HTML 文档中显示小于号，我们需要这样写：<或者 <

这里

nnnn; 或者 hhhh

& //& //空格

1 3 4 5 6 7 8

Å //Å而: å //

答：可以使用NCR的方式，先找到字符对应的UNICODE编码，以小于号为例，unicode编码16进制为3C(10进制为60)，在html则可以使用<或<，跟上面的表格对照看是否相同，由此我们也可以知道，如果我们的html所采用的编码不支持一些字符(比如其他国家的字符)，则可以通过NCR来引入我们的页面就不会乱码了。

有一天，我的一个好朋友在调试webservice时发现对方的接口返回类似hhhh这样的东西，一时不知道如何处理，如何转换为我们想要的编码呢？下一篇文章将提供通用的转换程序，敬请期待！

最后感谢网络上无名的作者，是你们的博文让我学得更多，谢谢！如不小心引入您的博文内容而未带上出处，请告知我一声。

七嘴八舌聊电竞

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
x开头的字符 java_&#x开头的是什么编码呢。浏览器可以解释它。如中国等同与中文"中国"?...

形如——dddd;hhhh;name;——的一串字符是 HTML、XML 等 SGML 类语言的转义序列(escape sequence)。它们不是「编码」。以 HTML 为例，这三种转义序列都称作 character reference：前两种是 numeric character reference(NCR)，数字取值为目标字符的 Unicode code point；以「」开头的后接十进制数...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。