《Python编程的术与道:Python语言进阶》视频课程
《Python编程的术与道:Python语言进阶》视频课程链接:https://edu.csdn.net/course/detail/28618
unicode, str,bytes
Unicode
当今的程序需要能够处理多种字符。应用程序经常被国际化,以各种用户可选语言显示消息和输出。同一程序可能需要输出英语、中文、法语、日语、希伯来语或俄语的错误消息。 Web内容可以用这些语言中的任何一种编写,也可以包含各种表情符号(emoji symbols)。 Python的字符串类型使用Unicode标准表示字符,这使Python程序可以使用所有这些可能的字符。
Unicode是计算机科学领域里的一项业界标准,包括字符集、编码方案等。计算机采用8比特一个字节,一个字节最大整数是255,还要表示中文一个字也是不够的。为了统一所有的文字编码,unicode为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
Unicode是一个规范,旨在列出人类语言使用的每个字符,并为每个字符提供唯一代码。
字符是文本的最小可能组成部分。 “ A”,“ B”,“ C”等都是不同的字符。 “È”和“Í”也是如此。
Unicode标准描述了如何用**代码点(code point)**表示字符。代码点值是一个介于0到0x10FFFF之间的整数(大约110万个值,到目前为止分配了11万个)。在表示一个Unicode的字符时,通常会用U+
然后紧接着一组十