【python】利用Python从文件中读取字符串（乱码问题）

最新推荐文章于 2022-04-03 20:28:38 发布

captain811

最新推荐文章于 2022-04-03 20:28:38 发布

阅读量920

点赞数

分类专栏： python 编程

本文链接：https://blog.csdn.net/captain811/article/details/79555442

版权

本文介绍了在Python3中如何处理文件编码问题，包括理解Python文件默认的Unicode编码，处理路径字符串的转义，以及在遇到乱码时如何使用`chardet`模块检测并解码文件。强调了保存Python文件时保持编码一致性的重要性。

摘要由CSDN通过智能技术生成

博客已经搬家到“捕获完成”：

https://www.v2python.com

　　python3中，py文件中默认的文件编码就是unicode，不用像python2中那样加u，比如u'中文'。
　　不过在涉及路径时，比如C:\Users\Administrator\Desktop\StudyNote\Python，还是要加r。
　　eg:r'C:\Users\Administrator\Desktop\StudyNote\Python'。
　　因为\是转义符，想输出'\'得写成'\\'才可以。加了r就可以让python自动处理字符串,不让'\'进行转义，因此最终的字符串就是C:\Users\Administrator\Desktop\StudyNote\Python的意思。

　　OK，继续讲。
　　首先要明确一点，你的py文件用什么文件编码不重要，都可以顺利执行。不过要保证一点，保存py文件时的编码必须与编码声明的一样。假设你的py文件开头有以下编码声明:
　　eg: # -*- coding: utf-8 -*-
　　那么保存py文件时的编码也要为utf-8。
　　另外再普及一下保存文件编码时的知识，用notepad++在选择编码模式的时候，有utf-8和utf-8 without BOM，这个BOM实际上是在文件开头加注了三个字符，用以表明本文件的编码方式为utf-8

最低0.47元/天解锁文章

captain811

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【python】利用Python从文件中读取字符串（乱码问题）

博客已经搬家到“捕获完成”：https://www.v2python.com　　python3中，py文件中默认的文件编码就是unicode，不用像python2中那样加u，比如u'中文'。　　不过在涉及路径时，比如C:\Users\Administrator\Desktop\StudyNote\Python，还是要加r。　　eg:r'C:\Users\Administrator...
复制链接

扫一扫

专栏目录