Python的编码和解码

本文详细介绍了Python中的编码与解码过程,包括ASCII、Unicode和UTF编码的区别和应用场景。ASCII编码仅支持256个字符,无法涵盖中文;Unicode编码支持大量语言,避免乱码问题,但占用空间较大;而UTF编码则通过变长字节解决Unicode存储空间问题,适应不同字符长度需求。
摘要由CSDN通过智能技术生成

文本处理

    Python的编码和解码
    
        编码
        
            将文件转换成二进制就是编码
            
            ASCII编码:
            
                只占用1个,也就是二进制8位
                一共有2的8次方  256中可能,覆盖了大小写英文字母和特殊符号
                
                注意:
                    中文超过了256个,需要使用中文gb2312编码,使用两个字节,2的16次方 共65526个汉字
                    
                    
            Unicode编码:
                支持上百种语言,为了解决跨语言信息传递出现乱码的情况
                使用2~4字节编码,拥有136690个字符
                使用Unicode编码,无论是什么文本都不会出现乱码
                几乎所有系统、编程语言默认都支持Unicode
                注意:
                    用Unicode编码存储会比ASCII编码多占用一倍的空间,为了解决这个问题需要使用UTF编码
                    
                    UTF编码将一个Unicode字符便面成一个1~6字节,英文被编译成1个字节,汉字被编译成3个字节,生僻字被编译成4~6字节
        解码
        
            将二进制转换为文件就是解码
            
            

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值