C#版 判断字符编码

public static string GetText(byte[] buff)
		{
			string strReslut = string.Empty;
			if (buff.Length > 3)
			{
				if (buff[0] == 239 && buff[1] == 187 && buff[2] == 191)
				{// utf-8
					strReslut = Encoding.UTF8.GetString(buff);
				}
				else if (buff[0] == 254 && buff[1] == 255)
				{// big endian unicode
					strReslut = Encoding.BigEndianUnicode.GetString(buff);
				}
				else if (buff[0] == 255 && buff[1] == 254)
				{// unicode
					strReslut = Encoding.Unicode.GetString(buff);
				}
				else if (isUtf8(buff))
				{// utf-8
					strReslut = Encoding.UTF8.GetString(buff);
				}
				else
				{// ansi
					strReslut = Encoding.Default.GetString(buff);
				}
			}

			return strReslut;
		}

		// 110XXXXX, 10XXXXXX
		// 1110XXXX, 10XXXXXX, 10XXXXXX
		// 11110XXX, 10XXXXXX, 10XXXXXX, 10XXXXXX
		private static bool isUtf8(byte[] buff)
		{
			for (int i = 0; i < buff.Length; i++)
			{
				if ((buff[i] & 0xE0) == 0xC0)    // 110x xxxx 10xx xxxx
				{
					if ((buff[i + 1] & 0x80) != 0x80)
					{
						return false;
					}
				}
				else if ((buff[i] & 0xF0) == 0xE0)  // 1110 xxxx 10xx xxxx 10xx xxxx
				{
					if ((buff[i + 1] & 0x80) != 0x80 || (buff[i + 2] & 0x80) != 0x80)
					{
						return false;
					}
				}
				else if ((buff[i] & 0xF8) == 0xF0)  // 1111 0xxx 10xx xxxx 10xx xxxx 10xx xxxx
				{
					if ((buff[i + 1] & 0x80) != 0x80 || (buff[i + 2] & 0x80) != 0x80 || (buff[i + 3] & 0x80) != 0x80)
					{
						return false;
					}
				}
			}
			return true;
		}

		// news.sohu.com
		private static bool isGBK(byte[] buff)
		{
			return false;
		}

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值