从ASCII,到Unicode 和 UTF-8特性介绍

ASCII (American Standard Code for information Interchange,美国信息交换标准代码)
7 bit来表示一个字符,共计可以表示128种字符。
我们知道,计算机内部,所有信息最终都是一个二进制值。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从00000000到11111111。
ASCII 码一共规定了128个字符的编码,比如空格SPACE是32,用二进制00100000,大写的字母A是65(二进制01000001)。这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的一位统一规定为0。
ASCII字母继续使用1字节存储,重音文字、希腊字母或西里尔字母等使用2字节来存储,而常用的汉字就要使用3字节。辅助平面字符则使用4字节。
在UTF-8+BOM格式文件的开首,很多时都放置一个U+FEFF字符(UTF-8以EF,BB,BF代表),以显示这个文本文件是以UTF-8编码。

ISO-8859-1:
8bit表示一个字符,即1个可用的字节(byte),共计可以表示256个字符。
gb2312:
2个字节来表示一个汉字。
gbk(支持更多的汉字) -> gb18030(简体) -> big5(台湾)
国际统一标准:unicode(所有国家通用,但是是2个字节来表示一个字符).

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,也是一种前缀码。它可以用来表示Unicode标准中的任何字符,且其编码中的第一个字节仍与ASCII兼容,这使得原来处理ASCII字符的软件无须或只须做少部分修改,即可继续使用.为了与以前的ASCII码兼容(ASCII为一个字节),因此UTF-8选择了使用可变长度字节来存储Unicode。ASCII是UTF-8的一个子集。因为一个纯ASCII字符串也是一个合法的UTF-8字符串,所以现存的ASCII文本不需要转换。为传统的扩展ASCII字符集设计的软件通常可以不经修改或很少修改就能与UTF-8一起使用。

unicode是一种编码方式,而utf是一种存储方式,utf-8是unicode的一种实现方式之一。

utf8_unicode_ci和utf8_general_ci区别?
在数据库系统MySQL或MariaDB中有多种字符集,其中utf8_unicode_ci和utf8_general_ci是最常用的,但是utf8_general_ci对某些语言的支持有一些小问题,如果可以接受,那最好使用utf8_general_ci,因为它速度快。否则,请使用较为精确的utf8_unicode_ci,不过速度会慢一些。

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Microsoft Visual Basic 是一种编程语言,用于开发Windows应用程序。它是Visual Basic语言的一种版本,由Microsoft公司开发和发布。 在编写和保存Visual Basic代码时,可以选择使用UTF-8编码格式。UTF-8是一种Unicode字符编码,它支持几乎所有国家和语言的字符。以UTF-8编码保存Visual Basic代码可以确保程序在不同语言环境下的正确显示和执行。 通过使用UTF-8编码,Visual Basic程序可以包含并处理多种语言的字符,如汉字、日语假名和俄语字母等。这对于开发国际化和本地化的应用程序非常重要。 在Visual Basic中,可以通过在源代码文件的顶部添加一个声明语句来指定UTF-8编码。例如,在文件的第一行添加"# encoding: utf-8",以告诉编译器使用UTF-8编码解析文件中的字符。 使用UTF-8编码的Visual Basic程序可以在不同平台和操作系统上运行,并且能够正确处理各种语言的输入和输出。这为开发者提供了更大的灵活性和广泛的应用范围。 总之,Microsoft Visual Basic支持UTF-8编码,这使得开发者能够开发面向不同语言和地区的应用程序,确保其正确显示和处理各种字符。 ### 回答2: Microsoft Visual Basic是一种面向对象的编程语言,最常用于Windows操作系统的开发。而UTF-8是一种常用的字符编码方式,可以支持几乎全部Unicode字符。 在Visual Basic中,可以使用UTF-8字符编码来处理字符串和文本数据。UTF-8编码使得编程者可以使用各种语言和符号来编写代码,包括ASCII字符、拉丁文字符、亚洲字符等。这样可以更好地满足全球化应用的需求。 使用UTF-8编码可以带来以下一些好处: 1. 支持更多语言:UTF-8支持世界上几乎所有的字符,包括所有的拉丁字母、亚洲字符、字母表、符号和特殊字符。这使得开发者能够在程序中使用不同语言和字符集,实现真正的国际化。 2. 更好的兼容性:UTF-8编码可以与ASCII兼容,这意味着可以无缝地与已经使用ASCII编码的项目进行集成和迁移。这使得旧项目可以很容易地升级到支持更多语言的版本。 3. 空间节省:相对于其他编码方式,UTF-8编码较为紧凑。由于其变长编码的特性,只需要多用一些字节来表示较少用的字符,而常用的ASCII字符仍然只占用1个字节。因此,使用UTF-8编码可以节省存储空间和网络传输带宽。 总之,Microsoft Visual Basic可以使用UTF-8编码来处理文本数据,这样可以更好地支持全球化应用,同时带来更好的兼容性和节省存储空间的好处。 ### 回答3: Microsoft Visual Basic 是一种广泛使用的编程语言,用于开发 Windows 系统下的应用程序。它提供了一种简单易学的编程环境,具有强大的功能。 UTF-8 是一种广泛使用的字符编码方式,它可以用来表示世界上几乎所有的字符。UTF-8 支持多种语言,包括英语、汉语、日语等。 在 Microsoft Visual Basic 中,我们可以通过一些方法来使用 UTF-8 编码。首先,我们需要将 Visual Basic 的编码设置为 UTF-8。可以在项目的属性设置中找到相关选项。设置好后,我们就可以使用 UTF-8 编码来处理和显示文本信息。 使用 UTF-8 编码可以帮助解决在不同语言之间进行文本传递和显示时可能出现的问题。例如,当我们需要在程序中显示中文时,使用 UTF-8 编码可以确保文字正确显示,避免乱码问题。 另外,在进行文件读写操作时,使用 UTF-8 编码也能确保文件的内容正确保存和读取。通过设置文件的编码方式为 UTF-8,我们可以在不同系统和平台上顺利地读写文件,并保持文字信息的一致性。 总而言之,Microsoft Visual Basic 可以与 UTF-8 编码相结合,帮助开发者处理和显示不同语言的文本信息,提供更好的国际化支持。这样我们就可以更轻松地开发面向全球用户的应用程序。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值