Linux 运行 python 出现的字符串编码问题

本文介绍了在Linux系统中运行Python时遇到的字符串编码问题。当在终端输入中文字符串,尽管`print()`正常显示,但其内部编码格式与Python的utf-8默认编码不符。解决方法涉及理解Linux系统编码、Python编码和文件编码的概念,并可以通过修改Linux系统编码来匹配Python的解码方式,确保数据正确解析。
摘要由CSDN通过智能技术生成

Linux 运行 python 出现的字符串编码问题

最近在想在树莓派上利用python爬去数据的时候遇上了点编码的问题,google查了一通之后还是靠自己摸索了一些解决方案,这里总结记录一下。

所遇问题

我在终端输入的中文字符串似乎被python自动转码了,虽然print()出来还是正常的中文,而且python默认编码格式也是utf-8,但是它的值,是个我不熟知的编码格式
中文字符串被自动转码

知识储备

为了解决这个问题,我们需要先了解以下知识

linux系统编码、python编码和文件编码的概念

  • 系统编码:
    系统编码是linux系统默认的编辑器的编码方式,它的作用是,我们所有通过编辑器输入的内容都将根据该编码方式转成二进制流存入到系统磁盘中。linux下可以通过 locale 命令查看系统编码(各个版本的linux系统可能都不相同)
  • python编码:
    指的是python内设置的解码方式,是python编译器将二进制流解码的一个规范,默认的是ascii解码方式(python3 似乎是 utf-8),一般来说如果源码中不存在中文的话,ascii则完全没有问题。
  • 文件编码:
    文本的编码方式,是你的一个文件内 内容的
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值