python字符编码使用ascii编码_UTF-8,ASCII,Unicode编码,Python字符串通用编码,utf8ASCIIUnicode,python,常用...

参考:https://www.cnblogs.com/chownjy/p/6625299.html;https://www.cnblogs.com/mlgjb/p/7899534.html

ASCII码

参考:https://baike.baidu.com/item/ASCII/309296?fromtitle=ascii%E7%A0%81&fromid=99077&fr=aladdin

((American Standard Code for Information Interchange): 美国信息交换标准代码)

只能编2^8个不同字符;一个字符使用8个bit位编码,也就是一个字节。只是不能表示更多的字符。

Unicode

又被称为

万国文字

,可以编码多个国家的文字。至少一个字符使用2个字节,汉字使用3个字节。这种编码的缺点是:对于可以使用一个字节编码的字符也只能使用2个字节完成。

UTF-8

英文字符使用1个字节,汉字使用3个字节,很好的解决了前面提到的两种编码方式出现的问题,因而得到广泛使用。

我国使用的其他编码方式

GBK,GB2312,BIG5。它们只局限于在国内使用,不被国外认可。在GBK编码中,中文汉字占2个字节

GBK,IBM 在发明 Code Page 的时候将GBK放在第 936 页,所以叫 CP936

现代计算机python的常见字符编码

现在计算机中,在内存中采用unicode编码方式。

字符串类

str

里有一个

encode()方法,它是从字符串向比特流的编码过程

。而

bytes

类型恰好有个

decode()方法,它是从比特流向字符串解码的过程

。除此之外,我们查看Python源码会发现bytes和str拥有几乎一模一样的方法列表,

最大的区别就是encode和decode

python3 三种字符串(无前缀,前缀u,前缀b),

无前缀和带“u”前缀:都是Unicode字符来存储的,也就是str类型的数据

“b”前缀的字符串:表示是使用ASCII码字符存储的,字符串中的字符只能是ASCII码中的字符,字符串类型是byte类型的数据

str类型和byte类型之间的转换

str→byte:使用 字串.encode(“utf-8”)

byte→str:使用 字串.decode(“utf-8”)

Type "help", "copyright", "credits" or "license()" for more information.

>>> a='jsagij'

>>> type(a)

>>> b=a.encode('utf-8') #对a进行编码

>>> type(b)

>>> c=b.decode()#对a进行解码

>>> type(c)

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值