python3中byte转str_Day168:python2与python3下编码分析

最新推荐文章于 2023-09-14 11:59:25 发布

Yiqin Fu

最新推荐文章于 2023-09-14 11:59:25 发布

阅读量114

点赞数

文章标签： python3中byte转str

本文链接：https://blog.csdn.net/weixin_31582915/article/details/112399537

版权

编码样式

乱码的根源就在于字符集编码不匹配导致，探索隐藏在编程过程中鲜为人知的字符集转换问题，将有助于从根源上解决乱码问题。

源码字符集：
英文the source character set，是指源代码文件是使用何种编码字符集保存和传输的。
执行字符集：
英文the execution character set，是指源代码经过编译、链接后的可执行文件是使用何种编码字符集保存的，程序实际执行时，内存中的字符串编码就是执行字符集。
运行环境编码：
是指操作系统(或者当前控制台环境)用于显示文字的编码字符集。

源代码文件(源码字符集)经过编译/链接，生成可执行文件(执行字符集)，最后程序运行于实际环境中(运行环境编码)。在这过程中如果有字符集不匹配，最终就无法显示预期的文字信息，甚至产生乱码。

编译器在编译源代码时，会将源码字符集转化为执行字符集，如果编译器不能正确识别源码字符集，就得不到正确的字符串数据。
可执行文件在实际运行环境中执行时，为了在控制台(或者其他UI)上显示出字符串，就要将执行字符集转化为运行环境的字符集。如果运行环境的字符集与执行字符集不同，也会导致乱码。

总结起来，要想使程序不会乱码，必须满足：

python2.7的默认编码方式为ascii字符集，这里所说的编码方式指执行编码方式，所以在源文件的开头，往往需要加上# -

关注