Python的老坑——中文编码问题

最新推荐文章于 2023-08-11 15:38:23 发布

seekiu

最新推荐文章于 2023-08-11 15:38:23 发布

阅读量549

点赞数

本文链接：https://blog.csdn.net/seekiu/article/details/41287997

版权

此前我一直在写一些简单的计算程序，很少需要处理中文，因此除了少量注释，绝大多数都是在用英文，因此虽然知道 Python 有编码这个坑，也一直只知道在文件开头放个 coding=utf-8 而已。而最近写一些处理文本的小程序，终于遇到了它。一番 Google 和小试验之后，总算大致摸清了规律。

最简单的，如果运行下面的程序（Windows的命令行中）：

a = '中文'
print a

显示出来的大概是：「涓枃」，也就是传说中的乱码了。正确的做法是在单引号前加一个小写的u，表明是 unicode 编码的。问题似乎解决了？

运行下面的代码时问题又来了：

a = raw_input(u'中文')
print a

还是报错，解决的办法（之一）是显式是指定一个字符串的编码方式，即raw_input('中文’.encode('mbcs')。

再有一个问题是，如果中文字符串已经在某个变量中，存储过程没有指定 Unicode 怎么办？也很简单：

a = '中文'
print a.decode('utf-8')

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

seekiu

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python的老坑——中文编码问题

此前我一直在写一些简单的计算程序，很少需要处理中文，因此除了少量
复制链接

扫一扫

python练习题：文本分析（1）——统计文件中的字符

XL1340571928的博客

10-03

4058

简单运用一些字符串单个字符判断

Android URL中关于中文特殊字符的编码

Chen_xiaobao的博客

12-22

3226

http://fengchj.com/?p=1940 还有一个文章“陈年老坑之 URL Encoding”也是这方面的文章：https://blog.jamespan.me/2015/05/17/url-encoding URL中的空格有时候被编码成%20，有时候被编码成加号+，曾经迷糊过一段时间，后来查了下资料才搞明白。一个URL的基本组成部分包括协议(s

参与评论您还未登录，请先登录后发表或查看评论

python中使用什么注释语句和运算_Python入门（一）

weixin_39633976的博客

12-02

919

Python是一种通用编程语言，在科学计算和机器学习领域有着广泛的应用。变量、运算符与数据类型1、注释-在Python中，‘#’表示注释，作用于整行-''' '''或者""" """表示区间注释，在三引号之间的所有内容被注释2、运算符算术运算符操作符 | 名称 | 示例:---:|:---:|:---:`+` | 加 | `1 + 1``-` | 减 | `2 - 1``*` | 乘 | `3 *...

凹语言™——名字的由来和寓意

光谷码农

07-29

4217

> **凹** 在此念：wā，凹语言™主页：https://wa-lang.org先讲个故事。2016年受命开发一个Web应用，作为一个C系老炮/Go新手/JS菜鸡，当真是一脸懵逼，然后就发现了Emscripten这个狼牙棒，最终以C内核+JS界面组成脸、Go组成屁股的形式交活了事。期间踩坑无数罄竹难书，我们开了一个仓库——[https://github.com/3...

诈尸了。不瞒您说，老坑从不填，天天开新坑

dotNET跨平台

01-23

148

诈尸了。你的年更 UP 诈尸了。不瞒您说，我其实有好多乱七八糟的东西想往外捯饬捯饬整理整理。写过博客，发过公众号，做过视频。但是这些对我整理分享知识来说都有一个硬伤：慢。而咱们 IT 工...

python简述文件目录相对路径_【Python】配置文件相对路径&软件自动执行的工作目录...

weixin_39926639的博客

11-28

今天对监控脚本做了一些变更，然后突然发现监控全部都失效了。。排查了半天问题仍然不知所踪。最终发现居然是一个踩过好几次的老坑。。就是脚本内写的配置文件为了调试方便写成了相对路径，但是在上线时没有意识到软件自动执行（比如Zabbix的externalcheck，虽然所有脚本都可以放在统一的目录下，给人一种这个目录就是zabbix执行外部检查时的工作目录的错觉，但是实际上并不是。。）时自动执行的工作目录...

踩进了 CoreData To-Many Ordered 问题的老坑

品雪其寒

09-08

2216

这已经是个老bug了，如果对多关系标成有序的，有些 Dynamically-Generated accessor Methods (add*) 会抛异常，还有一些干脆没生成。我居然又中招了！去年已经中过的，没记性呀！这绝逼是个bug，有人老早做过补丁：https://github.com/CFKevinRef/KCOrderedAccessorFix不过，这意思苹果的人是铁了心不修了，radar 上

老坑函数System

root的博客

10-30

158

老坑函数System System这个老坑函数大家都用过吗？这个函数可以用来坑坑你的小伙伴第一步你可以用一段你小伙伴需要的代码，比如数学黑洞 #include&lt;iostream&gt; #inlcude&lt;cstdlib&gt; #include&lt;algorithm&gt; #include&lt;cstdio&gt; #include&am

管理类联考——逻辑——论证逻辑——汇总篇——真题和典例——推论

stqer的博客

08-11

208

直接将选项代入题干。一般将缅甸所产的经过风化或经河水搬运至河谷、河床中的翡翠大砾石，称为“老坑玉”。老坑玉的特点是“水头好”、质坚、透明度高，其上品透明如玻璃，故称“玻璃种”或“冰种”。同为老坑玉，其质量相对也有高低之分，有的透明度高一些，有的透明度稍差些，所以价值也有差别。在其他条件都相同的情况下，透明度高的老坑玉比透明度较其低的单位价值高，但是开采的实践告诉人们，没有单位价值最高的老坑玉。以上陈述如果为真，可以得出以下哪项结论?A.没有透明度最高的老坑玉。

MBA逻辑真题答案与解析(最强真题集).pdf

11-13

消元法是解决这类问题的一种策略，通过消除重复的条件来简化问题。在这个例子中，通过消去共同的事件，可以得出王研究员不是张教授的哲学研究所同事的结论。 2. **逻辑论证**：在28题中，涉及到的是对老坑玉价值...

专题资料（2021-2022年）MBA联考综合真题.doc

10-07

这些题目共同体现了MBA联考综合能力测试中的逻辑推理、判断推理和数据分析能力，是MBA入学考试的重要组成部分，旨在评估考生的逻辑思维、问题解决和信息处理能力。通过这样的练习，考生可以提高批判性思考和决策制定...

翡翠的种类_详细介绍(附图).doc

09-29

1. 老坑玻璃种：这是翡翠中的顶级品种，透明度极高，犹如玻璃般清澈。由于产地古老，故称老坑。其内部质地细腻，常常伴有起莹现象，价值非常高。尽管也有不同档次，但总体而言，老坑玻璃种翡翠极为珍贵。 2. 冰种：...

2011MBA逻辑真题答案与解析(最强真题集).pdf

11-23

题目27的解析中提到了消元法，即通过消除共同因素来简化问题，找到答案。在这个例子中，通过消除“初中同学”、“博士”和“哲学研究所的人”这些共同因素，剩下的信息是“王研究员不是哲学研究所的人”，从而得出...

XXXX年MBA逻辑解读.pptx

10-31

这些题目是针对MBA逻辑推理能力的训练，涵盖了多种逻辑推理模式和问题解决技巧。我们逐一解析： 26. 题目涉及对比巴斯德和普歇关于微生物实验的不同结果。选项D解释了可能的原因，即干草浸液中含有的枯草杆菌能够在...

探索算法迷宫：揭秘寻找最短路径的神兵利器

08-19

数据结构是计算机科学中的一个基本概念，它指的是数据的组织、管理和存储方式，以及对数据的操作。数据结构使得数据的访问和修改更加高效和有序。常见的数据结构包括： 1. **数组**（Array）：一种线性数据结构，可以存储相同类型的元素，并通过索引访问。 2. **链表**（Linked List）：一种线性数据结构，由一系列节点组成，每个节点包含数据部分和指向下一个节点的指针。 3. **栈**（Stack）：一种后进先出（LIFO, Last In First Out）的数据结构，只能在一端进行添加或删除操作。 4. **队列**（Queue）：一种先进先出（FIFO, First In First Out）的数据结构，允许在一端添加元素，在另一端删除元素。 5. **哈希表**（Hash Table）：通过键值对存储数据的数据结构，可以快速地通过键来访问数据。 6. **树**（Tree）：一种层次结构的数据结构，每个节点有零个或多个子节点，通常用于表示具有层次关系的数据。 7. **图**（Graph）：由顶点（节点）和边组成，可以表示复杂的关系和网络结构。每种数据结构都有其

基于Android习惯养成APP设计与实现.docx

08-19

基于Android习惯养成APP设计与实现.docx

YOLO算法在生物信息学中的创新应用：从基因组到细胞成像

最新发布

08-19

YOLO（You Only Look Once）算法是一种流行的实时目标检测系统，通常用于计算机视觉领域。然而，其原理和效率同样适用于生物信息学领域，特别是在基因组学、蛋白质结构分析和细胞成像等方面。本文将探讨YOLO算法在生物信息学中的多种应用，包括基因组序列识别、蛋白质结构分类和细胞图像分析，并提供相应的代码示例。 YOLO算法在生物信息学领域展现出巨大的潜力，尤其是在需要快速和自动化分析的场景中。随着深度学习技术的不断进步，我们可以预见YOLO算法将在生物信息学中扮演越来越重要的角色。参考文献 YOLO: Real-Time Object Detection Deep Learning for Bioinformatics 请注意，本文为示例性质，实际编写时需要根据具体主题和要求进行调整和补充。

知识分享辅助工具 - ObsidianPublishToCSDN-V1.1.py

08-19

知识分享辅助工具：ObsidianPublishToCSDN-V1.1.py 简介优化：告别繁琐，拥抱高效！ObsidianPublishToCSDN-V1.1.py 是专为 Obsidian 用户打造的知识分享利器，旨在将您的笔记内容无缝对接至CSDN平台，让知识分享变得更加轻松快捷。核心功能亮点：智能图片提取：自动识别并收集Obsidian笔记中引用的所有图片，一键整理至指定文件夹，无需手动逐一查找，大幅提升发布效率。 Markdown优化转换：精准转换Obsidian的Markdown格式为CSDN兼容格式，保留原有排版与样式，确保内容呈现的专业与美观。双链处理：特别针对Obsidian的双链特性，提供灵活处理方案，无论是转换为普通链接还是保留注释说明，均可按需配置，让内容更加适应CSDN环境。高效文档生成：一键生成适用于CSDN发布的Markdown文档，减少手动编辑时间，让您的创意与知识更快触达读者。持续迭代更新：本工具正处于活跃开发阶段，我们倾听每一位用户的反馈，不断优化功能，修复bug，确保为您提供最稳定、最便捷的使用体验。

电网预测数据集，日期小时干球温度露点温度湿球温度湿度电力负荷电价

08-19

日期小时干球温度露点温度湿球温度湿度电力负荷电价