我们知道,数据传输都是通过Stream流【字节数组】来进行,如何对传入的数据流进行解析呢,这里就有字节数组 与 文本编码之间的转化。
主要编码格式有ASCII,Unicode,UTF-8,GBK(GB2312),Big5等.
C#是低字节在前的
表格:【英文、数字、中文】编码后占用字节个数
编码格式 | 英文 | 数字 | 中文 |
---|---|---|---|
ASCII | 一个字节,如A为65,a为97 | 一个字节,如0为48 | 一个字节,一般为?(63) |
Unicode | 两个字节,如A为65,0 | 两个字节,如0为48,0 | 两个字节 |
UTF-8 | 一个字节,如A为65,a为97 | 一个字节,如0为48 | 三个字节 |
GBK(GB2312) | 一个字节,如A为65,a为97 | 一个字节,如0为48 | 两个字节 |
新建.net 4.5窗体应用程序TextEncodingDemo。重命名Form1为FormTextEncoding
窗体设计如图:
窗体FormTextEncoding主要程序如下(忽略设计器自动生成的代码):
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading.Tasks;
using System.Windows.Forms;
namespace TextEncodingDemo
{
public partial class FormTextEncoding : Form
{
public FormTextEncoding()
{
InitializeComponent();
cboEncoding.Items.AddRange(new string[] { "ASCII", "Unicode", "UTF-8", "GBK" });
cboEncoding.SelectedIndex = 0;
}
private void btnToByteArray_Click(object sender, EventArgs e)
{
rtxtByteArray.Clear();
if (rtxtText.TextLength == 0)
{
rtxtText.Focus();
MessageBox.Show("请输入文本内容", "出错");
return;
}
Encoding encoding = Encoding.GetEncoding(cboEncoding.Text);
string[] resultArray = new string[rtxtText.Lines.Length];
for (int i = 0; i < rtxtText.Lines.Length; i++)
{
byte[] buffer = encoding.GetBytes(rtxtText.Lines[i].Trim());
resultArray[i] = string.Join(" ", buffer.Select(element => element.ToString("X2")));
}
rtxtByteArray.Lines = resultArray;
}
private void btnToText_Click(object sender, EventArgs e)
{
rtxtText.Clear();
if (rtxtByteArray.TextLength == 0)
{
rtxtByteArray.Focus();
MessageBox.Show("请输入字节数组", "出错");
return;
}
Encoding encoding = Encoding.GetEncoding(cboEncoding.Text);
string[] resultArray = new string[rtxtByteArray.Lines.Length];
for (int i = 0; i < rtxtByteArray.Lines.Length; i++)
{
string[] byteArray = rtxtByteArray.Lines[i].Trim().Split(' ');
List<string> byteList = byteArray.ToList();
//移除空格元素
byteList.RemoveAll(element => string.IsNullOrWhiteSpace(element));
if (byteList.Any(element => !new Regex("^[0-9A-Fa-f]{2}$").IsMatch(element)))
{
rtxtByteArray.Focus();
MessageBox.Show($"存在非法的十六进制字符串,请检查", "出错");
return;
}
resultArray[i] = encoding.GetString(byteList.Select(element => Convert.ToByte(element, 16)).ToArray());
}
rtxtText.Lines = resultArray;
}
private void btnClear_Click(object sender, EventArgs e)
{
rtxtText.Clear();
rtxtByteArray.Clear();
}
}
}
程序运行如图: