实用:python字符编码之间的转化(来猜猜博主的真实姓名)

本文介绍了Python解释器的默认编码以及ASCII和UTF-8的区别。ASCII码表包含0-255个元素,而UTF-8采用变长编码,使用1-6个字节表示字符。通过示例展示了字符与字节码之间的转换,并提出了一个问题:给定的UTF-16编码'fffe245cfd6c6579'对应的博主中文姓名。
摘要由CSDN通过智能技术生成

知识点
一:Python的解释器编码默认都采用UTF-8
二:ascii码表中一个字符(例如:字母)由1个字节组成,字节由8个位组成,位由0或1其中一个数字组成,所以一个字符可以由2^8次方种变化,即ascii码表编号0-255元素,元素可以是字母\数字或特殊符号
三:ascii编码用1个字节表示一个元素,但其他编码类型是由多个字节来表示编码中的一个元素
四:UTF-8采用一种变长的编码方案,使用 1~6 个字节表示一个元素,UTF-16则使用固定长度的编码方案,使用2个字节(16个位)表示一个元素,2^16次方种变化,即编号0-65535元素,这里的元素种类是在ascii码表的基础上又新增了多国的语言符号

打印ascii码表

bytes(range(255))

运行结果:

b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f !"#$%&\'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_`abcdefghijklmnopqrstuvwxyz{|}~\x7f\x80\x81\x82\x83\x84\x85\x86\x87\x88\x89\x8a\x8b\x8c\x8d\x8e\x8f\x90\x91\x92\x93\x94\x95\x96\x97\x98\x99\x9
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值