Unicode 转 GB2312/UTF8最简单的方式

原创 2012年03月25日 12:04:23

传统转换方式:

s = @"[\u79FB\u52A8]\u4E00\u5468\u70ED\u95FB\u56DE\u987E\uFF1A\u5F00\u53D1\u5546\u559C\u6B22\u63A8\u8350\u514D\u8D39\u6E38\u620F";
            
Regex reg = new Regex(@"(?i)\\u[a-f0-9]{4}");
Match mat = reg.Match(s);
while (mat.Success)
{
    char c = Convert.ToChar(Convert.ToInt32(mat.Value.Substring(2), 16));
    s = s.Replace(mat.Value, c.ToString());
    mat = reg.Match(s);
}
Console.WriteLine(s);

输出:

[移动]一周热闻回顾:开发商喜欢推荐免费游戏

借助于URLDecode转换:

s = @"[\u79FB\u52A8]\u4E00\u5468\u70ED\u95FB\u56DE\u987E\uFF1A\u5F00\u53D1\u5546\u559C\u6B22\u63A8\u8350\u514D\u8D39\u6E38\u620F";

s = System.Web.HttpUtility.UrlDecode(s.Replace(@"\u", "%u"));
Console.WriteLine(s);


字符集之间转换(UTF-8,UNICODE,Gb2312)

字符集之间转换(UTF-8,UNICODE,Gb2312)特搜集了UTF-8,UNICODE,Gb2312他们3个之间的相互转换.UTF-8:   1~3字节可变UNICODE: 2字节一个字符GB2...
  • xuweiqun
  • xuweiqun
  • 2006年11月07日 00:42
  • 35847

MFC中 GB2312、UTF-8、unicode 之间转换

//GB2312到UTF-8的转换 static int GB2312ToUtf8(const char* gb2312, char* utf8) { int len = MultiByteTo...
  • xiaopang1122
  • xiaopang1122
  • 2016年10月10日 10:21
  • 1596

Windows下Unicode(UCS2),UTF8,GBK(GB2312)互转

Windows下提供了两个编码转换函数:WideCharToMultiByte和MultiByteToWideChar。 用它们可实现Unicode(UCS2),UTF8,GBK(GB2312)互转...
  • gaojinshan
  • gaojinshan
  • 2012年08月14日 19:00
  • 5546

Python的ASCII, GB2312, Unicode , UTF-8 相互转换

ASCII 是一种字符集,包括大小写的英文字母、数字、控制字符等,它用一个字节表示,范围是 0-127 Unicode分为UTF-8和UTF-16。 UTF-8变长度的,最多 6 个字节,小于 127...
  • wanzhuan2010
  • wanzhuan2010
  • 2014年01月29日 10:00
  • 21438

[转] 用php实现gb2312和unicode(UTF-8)间的编码转换

gb2312 和 unicode (UTF-8)间的编码转换下面的例子是将 gb2312 转换为 "全"这种形式下面的例子是将 gb2312 转换为 "全"这种形式php4...
  • heiyeshuwu
  • heiyeshuwu
  • 2005年06月23日 13:30
  • 4046

ACSII,GB2312,GBK,GB18030,Unicode,UTF8,UTF16,UTF32,BOM区别与转换——字符编码最全总结

本人总结的最全字符编码概述,分享学习,涉及ACSII,GB2312,GBK,GB18030,Unicode,UTF8,UTF16,UTF32,BOM。 在做总结时被问到字符编码的知识,由于这块知识没...
  • yingmeng9913
  • yingmeng9913
  • 2015年09月29日 14:51
  • 1082

C++转换unicode utf-8 gb2312编码

windows开发环境下用VC++6.0 对unicode 、utf-8、 gb2312 三种编码格式之间的转换方法: #include #include #include using nam...
  • guzicheng
  • guzicheng
  • 2012年06月08日 14:44
  • 3302

利用iconv进行GB2312和Unicode的互转

利用iconv函数族进行编码转换 在LINUX上进行编码转换时,既可以利用iconv函数族编程实现,也可以利用iconv命令来实现,只不过后者是针对文件的,即将指定文件从一种编码转换为另一种编码。 ...
  • rankun1
  • rankun1
  • 2016年03月16日 16:38
  • 1259

VBS和ASP中的各种编码转换GB2312、UTF-8、Unicode、URL解码、二进制、十进制代码、十六进制

'UTF转GB---将UTF8编码文字转换为GB编码文字 function UTF2GB(UTFStr) for Dig=1 to len(UTFStr) '如果UTF8编码文字以%开头...
  • wqsys
  • wqsys
  • 2012年07月21日 10:11
  • 2997

Python的编码机制,unicode, utf-8, utf-16, GBK, GB2312,ISO-8859-1 等编码之间的转换。

1.unicode 缺失转换 如把 "/u5317/u4eac"转化成 gb18030的北京 s="/u5317/u4eac" s=eval("u'%s'"% s) s.encode(...
  • zbyufei
  • zbyufei
  • 2010年09月01日 22:21
  • 9377
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Unicode 转 GB2312/UTF8最简单的方式
举报原因:
原因补充:

(最多只允许输入30个字)