ASCII码对照表(Unicode 字符集列表)

🍺ASCII相关文章汇总如下🍺:

《中秋篇》

戈戈:看什么?
狄狄:看见了一个机器人。
戈戈:望什么?
狄狄:望见了一个睡在工位上的人。
戈戈:想什么?
狄狄:想起了一个难得随遇而安的人。


诗云:
天上星,
亮晶晶,
攀高峰,
登月宫。
湖边草,
盈盈绿,
杨柳枝,
多喜乐。
在这里插入图片描述

1、ASCII码

ASCII ( / ˈ æs k iː / ( listen ) ASS -kee ),是American Standard Code for Information Interchange的缩写,是一种用于电子通信的字符编码标准。ASCII 代码代表计算机、电信设备和其他设备中的文本。大多数现代字符编码方案都基于 ASCII,尽管它们支持许多附加字符。

ASCII最初基于英文字母表,将 128 个指定字符编码为 7 位整数。95 个编码字符是可打印的:包括数字0到9、小写字母a到z、大写字母A到Z和标点符号。此外,原始的 ASCII 规范包括 33 个源自电传打字机的非打印控制代码;其中大部分现在已经过时了,尽管有一些仍然常用,例如回车、换行和制表符代码。

例如,小写i将在 ASCII 编码中表示为二进制1101001 =十六进制69(i是第九个字母)=十进制105。
在这里插入图片描述

  • ASCII chart from a pre-1972 printer manual
    在这里插入图片描述
  • ASCII (1963). Control pictures of equivalent controls are shown where they exist, or a grey dot otherwise.
    在这里插入图片描述
  • Control code chart
    在这里插入图片描述
  • Printable characters
    在这里插入图片描述
  • Character set
    在这里插入图片描述

2、摩尔斯电码

摩尔斯电码(Morse’s code)是电信中使用的一种方法,用于将文本字符编码 为两种不同信号持续时间的标准化序列,称为点和破折号,或滴答声和达赫斯。

摩尔斯电码以电报的发明者之一塞缪尔·莫尔斯命名。

国际摩尔斯电码对 26 个基本拉丁字母 a到z、一个带重音符号的拉丁字母 ( é )、阿拉伯数字以及一小组标点符号和程序信号 ( prosigns ) 进行编码。大小写字母没有区别。

每个摩尔斯电码符号由一系列的dits和dahs组成。抖动持续时间是摩尔斯电码传输中时间测量的基本单位。dah的持续时间是dit持续时间的三倍。每滴滴或编码字符中的dah后面是一段没有信号的时间,称为空格,等于dit持续时间。一个单词的字母由一个持续时间等于三个点的空格分隔,而单词由一个等于七个点的空格分隔。
在这里插入图片描述
摩尔斯电码表 26 个字母和 10 个数字:
在这里插入图片描述

  • International Morse code is composed of five elements:
  1. short mark, dot or dit ( ▄ ): “dit duration” is one time unit long
  2. long mark, dash or dah ( ▄▄▄ ): three time units long
  3. inter-element gap between the dits and dahs within a character: one dot duration or one unit long
  4. short gap (between letters): three time units long
  5. medium gap (between words): seven time units long
  • 一些教授摩尔斯电码的方法使用二分搜索表。
    在这里插入图片描述

3、语言字符集

3.1 地图分布

在这里插入图片描述

在这里插入图片描述

3.2 汉字

GB/T 2312-1980是中华人民共和国的主要官方字符集,用于简体中文字符。GB2312是EUC-CN的注册互联网名称,是其通常的编码形式。GB指的是国标(国家标准),而T后缀(推荐; tuījiàn;‘推荐’)表示非强制性标准。

截至 2021 年 11 月,GB2312 是网络上最流行的声明的中文特定编码,6.9% 的网页来自中国和声明它的地区,和全球所有网页的 0.1%,从 3.5% 下降在 2010 年 1 月。但是,请注意,所有主要的 Web 浏览器都将标记为“GB2312”或“ GB 2312 ”的文档解码(而不是全部用于“GB_2312”),就好像它被标记为“ gbk ”,是超集编码,GB 2312和 GBK 的份额合计为 9.1%(或全球不到 0.2%)。
在这里插入图片描述
在这里插入图片描述
中文、日文和韩文 ( CJK ) 文字具有共同的背景,统称为CJK 字符。在称为汉化的过程中,共同(共享)字符被识别并命名为CJK统一表意文字。从 Unicode 14.0 开始,Unicode 总共定义了 92,865 个 CJK 统一表意文字。

历史上,越南也使用汉字,因此有时使用缩写CJKV。越南语的使用在 1920 年代被基于拉丁语的越南字母表所取代。
在这里插入图片描述
名为CJK Unified Ideographs (4E00–9FFF) 的基本块包含U+4E00 到 U+9FFF 范围内的20,992 个基本汉字。该块不仅包括中国文字系统中使用的字符,还包括日本文字系统中使用的汉字和汉字,这些文字在韩国的使用正在减少。

3.3 拉丁语

Basic Latin或C0 Controls 和 Basic Latin Unicode 块是Unicode标准的第一个块,也是唯一在UTF-8中以一个字节编码的块。该块包含 ASCII 编码的所有字母和控制代码。它的范围从 U+0000 到 U+007F,包含 128 个字符,包括C0 控件、ASCII标点和符号、ASCII 数字、英文字母的大写和小写以及一个控制字符。

基本拉丁语块从 Unicode 标准 1.0.0 版开始以目前的形式包含在内,没有添加或更改字符库。[3]它在 Unicode 1.0 中的块名称是ASCII。
在这里插入图片描述

3.4 希腊语

希腊语和科普特语是表示现代(单调)希腊语的Unicode 块。它最初用于编写科普特语,[1]使用类似的希腊字母,除了独特的科普特语添加。从Unicode标准 4.1 版开始,Unicode 中包含了一个单独的科普特语块,允许在风格上形成对比的混合希腊语/科普特语文本,这是学术作品中的惯例。
在这里插入图片描述

3.5 阿拉伯语

Thaana是一个Unicode 块,包含用于在马尔代夫编写迪维希语和阿拉伯语的Thaana 脚本字符。
在这里插入图片描述

3.6 西里尔文

西里尔文是一个Unicode 块,其中包含用于使用西里尔拼写法编写最广泛使用的语言的字符。该块的核心基于ISO 8859-5标准,并增加了少数民族语言和历史正字法。

在这里插入图片描述

3.7 蒙古文

蒙古语是一个包含蒙古语、满语和锡伯语方言字符的Unicode 块。它传统上是在文字方向 TDright.svg页面上自上而下以垂直线书写,尽管 Unicode 代码图表引用旋转到水平方向的字符,因为这是支持垂直方向布局的字体中字形的方向。
在这里插入图片描述

3.8 日语

在这里插入图片描述

片假名是一个Unicode 块,其中包含日语和阿伊努语的片假名字符。
在这里插入图片描述
平假名是包含日语平假名字符的Unicode 块。
在这里插入图片描述
片假名语音扩展是一个Unicode 块,除了片假名块中的字符之外,还包含用于书写阿伊努语的附加片假名小字符。
在这里插入图片描述

3.9 韩语

韩语的书写系统是由字符部分( jamo )组成的“音节字母表”,这些字符部分被组织成代表音节的字符“块”(geulja ) ,这些字符部分不能在计算机上从左到右书写,就像在许多西方语言。因此,韩语中每个可能的音节都必须由字体呈现为“音节块” ,或者每个字符部分单独编码。

Unicode有这两种选择,例如,字符部分 ㅎ (h) 和 ㅏ (a) 分别编码,还有组合音节 하 (ha)。

在这里插入图片描述
在这里插入图片描述

  • Unicode 中的韩文 jamo 字符
    在这里插入图片描述
  • Unicode 中的韩文兼容性 Jamo 块
    在这里插入图片描述

4、其他字符集

4.1 易经卦符

Yijing Hexagram Symbols是一个Unicode 块,包含来自《易经》的 64 个卦。
在这里插入图片描述

4.2 太玄经符号

太玄经是一种类似于易经(易经)并受其启发的占卜文字。《易经》以六十四卦为基础(六横行的序列,每行可断或不断),《太玄经》采用八十一三卦(四行的序列,每行可不断、断一次或断)两次)。就像《易经》一样,它可以通过铸造蓍草茎或六面骰子来生成定义四边形线条的数字来作为神谕进行咨询,然后可以在文本中查找这些数字。[需要进一步解释] 无动线绘制的四角星是指四角星描述,而动线绘制的四角星是指特定的线。
在这里插入图片描述

4.3 音乐符号

Musical Symbols是一个Unicode 块,包含用于表示现代音乐符号的字符。支持它的字体包括Bravura、Euterpe、FreeSerif、Musica和Symbola。MusicXML格式支持的标准音乐字体布局 ( SMuFL )通过使用基本多语言平面中的私人使用区域扩展了音乐符号 Unicode 块的 220 个字形,允许接近 2600 个字形。
在这里插入图片描述

4.4 象棋符号

Chess Symbols是一个Unicode 块,其中包含除了Miscellaneous Symbols块中基本的西洋象棋符号之外的国际象棋符号字符,以及代表象棋(中国象棋)棋子的符号。
在这里插入图片描述

4.5 炼金术符号

炼金术符号是一个Unicode 块,其中包含古代和中世纪炼金术文本中使用的化学物质和物质的符号。
截至 2021 年,很少有字体支持此块中的多个字符。可以免费供个人使用的一种是Symbola 14.0。
在这里插入图片描述

4.6 多米诺骨牌

Domino Tiles是一个Unicode 块,包含用于在多米诺骨牌中表示游戏情况的字符。该块包括标准六点拼贴组的符号以及水平和垂直方向的背面。
在这里插入图片描述

4.7 麻将牌

麻将牌是一个Unicode 块,包含描述麻将游戏中使用的标准牌组的字符。
在这里插入图片描述

4.8 扑克牌

Unicode是用于处理字体和符号的计算行业标准。在它里面是一组描绘扑克牌的图像,以及另一个描绘法国纸牌套装的图像。

Unicode 6.0 添加了以下图片:标准法式牌组的 52 张牌、4张塔罗牌骑士、一张牌的背面,以及 U+1F0A0–1F0FF 区块中的黑色和白色(或红色)小丑两张。Unicode 7.0 增加了一个特定的红色百搭牌和二十二张通用王牌,其参考描述不是意大利套牌马赛塔罗牌或其衍生品(通常用于纸牌术),而是法国新塔罗牌用来玩塔罗牌。
在这里插入图片描述

4.9 盲文

Unicode 块 盲文模式(U+2800…U+28FF) 包含 8 点盲文单元格的所有 256 种可能模式,从而包括完整的 6 点单元格范围。在 Unicode 中,盲文单元格没有定义字母或含义。例如,Unicode没有定义U+2817 ⠗ 成为“R”。
在这里插入图片描述

结语

如果您觉得该方法或代码有一点点用处,可以给作者点个赞,或打赏杯咖啡;╮( ̄▽ ̄)╭
如果您感觉方法或代码不咋地//(ㄒoㄒ)//,就在评论处留言,作者继续改进。o_O???
如果您需要相关功能的代码定制化开发,可以私聊留言作者。(✿◡‿◡)
感谢各位童鞋们的支持!( ´ ▽´ )ノ ( ´ ▽´)っ!!!

在这里插入图片描述

  • 19
    点赞
  • 96
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: ASCII码对照表是一份将二进制数字与对应的字符相匹配的表格。由于计算机只能识别二进制数字,因此需要一个标准来将字符转换为数字。ASCII码对照表就是为此而设计的。它是由美国信息交换标准化委员会于1963年发布的标准。 ASCII码对照表最初只包含了128个字符,其中包括了大小写字母、数字、标点符号和一些控制字符。后来,为了满足更多的语言和特殊字符的需求,扩展ASCII码逐渐出现,使用了更高的位数来表示更多的字符,如ISO-8859等。 现在,ASCII码已成为计算机编程中不可或缺的一部分。在网络通信、流媒体传输、电子邮件、文本编辑器等各种场合都能看到ASCII码的应用。因此,熟悉和掌握ASCII码对照表成为众多计算机工程师和软件开发人员必备的技能之一。 ASCII码对照表的PDF文件可以更便捷地下载和存储,方便使用者随时查阅。通过对ASCII码对照表的学习,可以更好地理解计算机编程中使用的字符和数字的对应关系,提高编程效率和代质量。 ### 回答2: ASCII码对照表是一种计算机编系统,它将数字、字母和其他符号转换成计算机可以识别的二进制代。它是美国信息交换标准代,也称为ASCIIASCII码对照表可以帮助人们了解字符与它们的二进制代之间的关系,这对于程序员和数据处理人员来说尤其重要。它提供了对照表的下载,可以以pdf、png、html等格式阅读。通过阅读ASCII码对照表,我们可以轻松地找到任何字符的十进制、十六进制及二进制代,也可以查看例如“退格”、“换行”、“回车”、“制表符”等特殊字符的编。此外,由于ASCII码是公认的标准,不同计算机系统之间的文件和文本都可以相互识别,大大简化了数据交换过程。因此,下载一份ASCII码对照表可以帮助人们更轻松地工作和交流。 ### 回答3: ASCII码对照表是一个十分重要的工具,它将ASCII码和对应的字符一一映射起来,方便人们查询字符编和读取文本文件。ASCII码是一种7位编方案,最多能够表示128种字符,包括英文字母、数字和一些特殊符号。ASCII码对照表通常以表格形式呈现,每个字符一行,显示该字符的十进制、十六进制和二进制编值。 有些 ASCII码对照表还会包含扩展 ASCII 和 ANSI 。扩展 ASCII 则把字符编的范围扩大到了256个,用来表示更多语言的字符,同时还有一些特殊符号,如音符、箭头等。ANSI 则是一种 Windows 操作系统下的字符编标准,常用于表示拉丁文、西欧字符等等。 对于程序员来说,熟悉 ASCII码对照表是非常必要的,因为ASCII码是计算机内部存储字符的方式之一,也是编写程序时输入输出字符的基础。对于使用计算机的用户来说,掌握 ASCII码对照表同样非常有用,能够帮助他们更加高效地使用电脑。 最后,如果需要查询 ASCII码对照表,可以在网络上搜索相关资源,或者直接使用计算机自带的字符映射工具,如 Windows 下的“字符映射表”。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值