python编码格式

本文介绍了Python编程中常见的编码格式问题,包括ASCII码的原理和局限,Unicode的产生背景和编码方式,以及UTF-8编码的规则。重点讨论了UTF-8如何解决多语言字符的表示,并提到了在Python中设置UTF-8编码格式的方法。
摘要由CSDN通过智能技术生成

我们在写代码的时候经常会遇到乱码等问题,其实就是因为编码格式不正确,那我们现在来简单看一下关于编码的相关知识

一、ASCII 码

计算机存储数据是用0、1存储的,为了存储英文字符等,所以出现了一个ASCII编码表,通过这个表就是把对应的英文转换对应为相应的0、1数据存储到计算机,但是英文只有26个字母,中文有6万多汉字,ASCII编码不够,所以根据需要就出现了unicode、utf-8等编码,实际可以理解为它们把全球的文字编码对应到计算机的0、1来存储识别。

ASCII 码使用指定的 7 位或 8 位二进制数组合来表示 128 或 256 种可能的字符。标准 ASCII 码也叫基础ASCII码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 到 9、标点符号, 以及在美式英语中使用的特殊控制字符。其中:

  • 0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(振铃)等。通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;

  • ASCII值为 8、9、10 和 13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。

  • 32~126(共95个)是字符(32sp是空格),其中48~57

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python的字符编码格式与系统字符编码息息相关。在了解Python编码前,我们先看一下系统字符编码相关的知识。 Python的字符编码问题,特别是涉及到文的显示时,乱码、报错一直是让新手头疼的事情。 Python常见的编码格式有ASCII、UTF-8、GBK等。ASCII编码是最基本的字符编码,只能表示英文字母、数字和一些特殊符号。而UTF-8是一种可变长度的编码格式,它可以表示世界上所有的字符。在Python 3,默认使用的字符编码是UTF-8。 在Python,字符编码的转换是通过str和bytes类型来实现的。str类型是Unicode编码的字符序列,而bytes类型是字节序列。str与bytes可以相互转换,通过str.encode()方法可以将str转换为bytes,而通过bytes.decode()方法可以将bytes转换为str。 总结起来,Python的字符编码格式主要包括ASCII、UTF-8、GBK等,而在Python 3,默认使用的是UTF-8编码格式。字符编码的转换可以通过str和bytes类型之间的相互转换来实现。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [一篇文章彻底搞懂Python字符编码方式(文编码,UTF-8,unicode,gb,gbk,文乱码,爬虫文乱码)](https://blog.csdn.net/m0_58859743/article/details/124679850)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值