asp.net 16进制字符串转为中文字符串

有时候抓取别人的网页会遇到一些类似于\u1123 这样的16进制的字符串,在网上查了一下,这些字符串转为中文的代码,特记录如下。代码从网上搜的,版权鬼原作者所有。

        public static string GetGBString(string content)
        {
            string strreg = @"\\u([0-9a-fA-F]{4})";
            System.Text.RegularExpressions.Regex reg = new System.Text.RegularExpressions.Regex(strreg,
                System.Text.RegularExpressions.RegexOptions.IgnoreCase);
            System.Text.RegularExpressions.MatchEvaluator evaluator = new System.Text.RegularExpressions.MatchEvaluator(ReplaceMatchEvaluator);
            string result = reg.Replace(content, ReplaceMatchEvaluator);
            return result;


        }
        private static string ReplaceMatchEvaluator(System.Text.RegularExpressions.Match m)
        {
            string reult = ToGB2312(m.Value);
            return reult;

        }
        
        /// <summary>
        /// 16进制字符串转为中文
        /// </summary>
        /// <param name="str"></param>
        /// <returns></returns>
        private static string ToGB2312(string str)
        {
            string r = "";
            System.Text.RegularExpressions.MatchCollection mc = System.Text.RegularExpressions.Regex.Matches(str, @"\\u([\w]{2})([\w]{2})", System.Text.RegularExpressions.RegexOptions.Compiled | System.Text.RegularExpressions.RegexOptions.IgnoreCase);
            byte[] bts = new byte[2];
            foreach (System.Text.RegularExpressions.Match m in mc)
            {
                bts[0] = (byte)int.Parse(m.Groups[2].Value, System.Globalization.NumberStyles.HexNumber);
                bts[1] = (byte)int.Parse(m.Groups[1].Value, System.Globalization.NumberStyles.HexNumber);
                r += Encoding.Unicode.GetString(bts);
            }
            return r;
        }


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值