python3解释器执行not 1 and 1_Python-解释器执行文件的三个阶段

本文详细介绍了Python3解释器执行文件的三个阶段,重点关注了编码设置和字符串存储。在Python3中,字符串以Unicode格式存储,避免了乱码问题。文章通过示例展示了编码和解码过程,并解释了在Python2中如何处理编码差异以确保正确显示。
摘要由CSDN通过智能技术生成

1、 python解释器执行文件的前两个阶段

执行py文件的前两个阶段就是python解释器读文本文件的过程,与文本编辑读文本文件的前两个阶段没有任何区别,要保证读不乱码,则必须将python解释器读文件时采用的编码方式设置为文件当初写入硬盘时的编码格式,如果没有设置,python解释器则才用默认的编码方式,在python3中默认为utf-8,在python2中默认为ASCII。

我们可以通过指定文件头来修改默认的编码:

# 在文件首行写入包含#号在内的以下内容

# coding: 当初文件写入硬盘时采用的编码格式

解释器会先用默认的编码方式读取文件的首行内容,由于首行是纯英文组成,而任何编码方式都可以识别英文字符。

2、python解释器执行文件的第三个阶段

设置文件头的作用是保证运行python程序的前两个阶段不乱码,经过前两个阶段后py文件的内容都会以unicode格式存放于内存中。在经历第三个阶段时开始识别python语法,当遇到特定的语法name = ‘上’(代码本身也都全都是unicode格式存的)时,需要申请内存空间来存储字符串’上’,这就又涉及到应该以什么编码存储‘上’的问题了。在Python3中,字符串类的值都是使用unicode格式来存储由于Python2的盛行是早于unicode的,因此在Python2中是按照文件头指定的编码来存储字符串类型的值的(如果文件头中没有指定编码,那么解释器会按照它自己默认的编码方式来存储‘上’),所以,这就有可能导致乱码问题

# coding:utf-8

x = '上' # x的值为untf-8格式的二进制

print(x) # 打印操作是将x的值,即utf-8格

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值