1byte(字节)=8bit(位);
在C/C++中:1byte=8bit;
在C#中:2byte=2*8bit;
在Java中:
- UTF8编码中,英文字符占用一个字节;绝大多数汉字占用三个字节,个别汉字占用四个字节;
- UTF16编码中,英文字符占两个字节;绝大多数汉字(尤其是常用汉字)占用两个字节,个别汉字(在后期加入unicode编码的汉字,一般是极少用到的生僻字)占用四个字节。
在Python中:
- 如果是utf-8编码,那么一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。
- 如果是gbk编码,那么一个中文包含繁体字等于两个字节,一个英文字符等于一个字节。