java字符转成ncr_NCR字符编码（形如xx）转换为汉字 in JAVA

最新推荐文章于 2023-01-11 13:03:35 发布

weixin_39806603

最新推荐文章于 2023-01-11 13:03:35 发布

阅读量560

点赞数

文章标签： java字符转成ncr

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39806603/article/details/114858981

版权

numeric character reference(NCR)，数字取值为目标字符的 Unicode code point；以「」开头的后接十进制数字，以「」开头的后接十六进制数字。

「中国」二字分别是 Unicode 字符 U+4E2D 和 U+56FD，十六进制表示的 code point 数值「4E2D」和「56FD」就是十进制的「20013」和「22269」。所以——

中国中国

——这两种 NCR 写法都会在显示时转换为「中国」二字。

在爬取人人网的学校各个院系名称结果时，得到的数据如下：

院系

临床医学院

交通学院

人文与管理学院

人文学院

这其中形如 '临床医学院' 的便是NCR编码了，使用UNICODE在线转换工具可以将其直接转换为汉字，但事实上它又不是UNICODE，区别似乎就在于Unicode是以u\进行分割，而NCR是以进行分割。后面数字字母内容是一样的，都有十进制与十六进制两种表示形式

在国内网上搜索NCR编码转换原文字，无果。在stackoverlow上找到了一种方法in JAVA 试了一下可以运行，没想到并不需要什么函数，只要一个(char)的强制转换就行。。虽然原理还是不太完全明白

public static String ConvertDecimalNCRToString(String hex){

String myString = hex.replace("", "");

String[] split = myString.split(";");

StringBuilder sb = new StringBuilder();

for (int i = 0; i

{

sb.append((char)Integer.parseInt(split[i]));

}

return sb.toString();}

weixin_39806603

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java字符转成ncr_NCR字符编码（形如xx）转换为汉字 in JAVA

numeric character reference(NCR)，数字取值为目标字符的 Unicode code point；以「」开头的后接十进制数字，以「」开头的后接十六进制数字。「中国」二字分别是 Unicode 字符 U+4E2D 和 U+56FD，十六进制表示的 code point 数值「4E2D」和「56FD」就是十进制的「20013」和「22269」。所以——中国中国——这两种 N...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。