python开头编码cc手_python的编码问题整理-CSDN博客

本文链接：https://blog.csdn.net/weixin_32820131/article/details/114428275

本文详细介绍了Python中的编码和解码概念，包括ASCII、GBK、unicode和UTF-8的区别。在Python 2中，由于默认使用ASCII编码，导致在CMD中打印中文和open()文件时可能出现乱码问题。而在Python 3中，默认编码为UTF-8，乱码问题得到缓解。此外，文章还讨论了requests库在处理不同编码网页内容时的注意事项。

摘要由CSDN通过智能技术生成

一、编码和解码

1、编码(encode)：将人类可以识别的语言(英文、中文等)转化成机器语言(01串)的过程，用于存储。

2、解码(decode):将机器语言转化成人类可识别的语言的过程，用于显示。

编码类型

1、ASCII编码：最早使用的编码方式

2、GBK编码：为了兼容中文，非ASCII编码

3、unicode编码：为了兼容所有语言，从ASCII扩展而来

4、utf-8编码：为了节省空间，对unicode的优化

二、py2中的string编码

1、python2默认的是ASCII编码方式

2、unicode是真正意义上的字符串；str是字节串。

3、乱码处理

1)cmd中的乱码

现象：

新建hello.py文件，内容如下

1 #coding:utf-8

2 print '果果'

在cmd中运行python hello.py

解决方法：中文前增加“u”

1 #coding=utf-8

2 print u"果果"

运行结果

原因

我们在win下的终端即cmd.exe去执行，cmd.exe本身也一个软件；当我们python2 hello.py时，python2解释器(默认ASCII编码)去按声明的utf8编码文件，而文件又是utf8保存的，所以没问题；问题出在当我们print'苑昊'时，解释器这边正常执行，也不会报错，只是print的内容会传递给cmd.exe用来显示，而在py2里这个内容就是utf8编码的字节数据，可这个软件默认的编码解码方式是GBK，所以cmd.exe用GBK的解码方式去解码utf8自然会乱码。

2)open()中的乱码

现象：

创建hello文本，保存成utf8:

我爱中国

代码如下

1 #coding=utf-8

2 f=open('hello.txt')3 print f.read()

运行结果

C:\Python27\python.exe E:/pyClass/temp/hello.py

鎴戠埍涓浗

解决：

open()中加入encoding='utf-8'关键字参数，但是open()方法没有此参数；使用codecs.open(),代码如下：