常用的编码简介及windows下.txt编码识别方法

1、ASCII 字符集

ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)是基于罗马字母表的一套电脑编码系统,它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO 646

包含内容:

控制字符:回车键、退格、换行键等。

可显示字符:英文大小写字符、阿拉伯数字和西文符号

ASCII扩展字符集扩展:表格符号、计算符号、希腊字母和特殊的拉丁符号。 

字符排布:

0~32号及第127号(共34个)

是控制字符或通讯专用字符,如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BEL(振铃)等;通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等; 

33~126号(共94个)

是字符

48~57号为0~9十个阿拉伯数字;

65~90号为26个大写英文字母;

97~122号为26个小写英文字母;

其余为一些标点符号、运算符号等。  
  

注意:

在计算机的存储单元中,一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。

所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。

 奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非   偶数,则在最高位b7添1。



2、ANSI编码

GB2312 字符集
   GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码字符集·基本集》,由原中国国家标准总局发布,1981年5月1日实施,是中国国家标准的简体中文字符集。它所收录的汉字已经覆盖99.75%的使用频率,基本满足了汉字的计算机处理需要。在中国大陆和新加坡获广泛使用。

   GB2312收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。其中包括6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。 
   GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。
它是用双字节表示的,两个字节中前面的字节为第一字节,后面的字节为第二字节。习惯上称第一字节为“高字节” ,而称第二字节

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: ANSI编码格式是一种常见的字符编码格式,它可以用来将文本、图像和其他数据在不同的计算机环境中进行编码和解码。它是一种通用的标准,用于在不同的计算机系统之间交换信息。它可以存储256种不同的字符,其中包括ASCII字符集以及拉丁字符、中文和其他多语言。 ### 回答2: ANSI编码格式是一种将字符和数字转换成计算机可以识别和存储的二进制数据的方式。它是由美国国家标准化组织(ANSI)制定的一套字符编码标准。 ANSI编码格式最常见的是ANSI字符集,它使用一个字节(8个比特)来表示每个字符。这套编码格式可包括128个字符,其中包括英文字母、数字、标点符号和一些特殊字符。它最早用于ASCII(美国信息交换标准代码)编码标准,后来逐渐发展为包括更多字符的标准。 然而,由于只有128个字符的限制,无法满足其他语言的需求。为了解决这个问题,ANSI编码格式发展出了多种变体,如ANSI/Windows-1252、ANSI/Windows-1251等,它们可以支持不同的语言字符集,如西欧语言、东欧语言等。 然而,随着全球化和国际化的发展,ANSI编码格式的局限性逐渐暴露。为了应对不同国家和地区的字符需求,Unicode编码格式应运而生。Unicode采用16位或32位的编码方案,能够表示更多的字符和符号,包括全球各种文字和符号。与ANSI相比,Unicode提供了更全面、更统一的字符编码方案,被广泛应用于互联网和计算机系统。 总之,ANSI编码格式是一种用于字符和数字转换的标准,它通过使用1字节表示每个字符来编码。虽然ANSI编码格式有局限性,但它为ASCII以及其他语言的字符编码提供了一种基础。随着技术的发展,Unicode编码格式逐渐取代了ANSI,成为主流的字符编码标准。 ### 回答3: ANSI是一种字符编码格式,全称为American National Standard Institute,中文名称为美国国家标准学会,它定义了一套字符编码标准。最早是在美国开发的,被广泛用于英文环境中。 ANSI编码格式最初是为了解决英文字符的编码问题,它使用了一个字节(8位)来表示一个字符,总共支持了128个字符,包括英文字母、数字、标点符号、控制字符等。其中,前32个字符是控制字符,用于控制打印机和终端设备的操作,如换行、退格等。 随着计算机的普及和发展,ANSI编码逐渐扩展了字符集,形成了ANSI编码的扩展版本,比如Windows系统中的常用编码格式ANSI(Windows-1252),它支持了更多的字符,包括欧洲语言中的特殊字符。 但是需要注意的是,ANSI编码格式是一种单字节编码,只能支持有限的字符集,无法满足全球范围内各种语言的需求。随着国际化和多语言环境的需求增加,逐渐被Unicode编码所取代。 总结来说,ANSI编码格式是一种最初用于英文环境的字符编码,使用一个字节表示一个字符,支持128个字符,后来发展出更多扩展版本,但由于其局限性,逐渐被Unicode编码所取代。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值