令人头疼的字符编码的问题

最新推荐文章于 2024-09-14 19:55:48 发布

weixin_30889885

最新推荐文章于 2024-09-14 19:55:48 发布

阅读量69

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/ppp1314520818/p/7574842.html

版权

现在计算机系统通用的字符编码工作方式总结如下：

1.在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

2.用记事本编辑的时候，从文件读取的UTF-8字符被转换为Unicode字符到内存里；

3.编辑完成后，保存的时候再把Unicode转换为UTF-8保存到文件；

4.浏览网页的时候，服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器。

python字符串问题处理：两种字符串如何相互转换？

字符串'xxx'虽然是ASCII编码，但也可以看成是UTF-8编码，而u'xxx'则只能是Unicode编码。

A.把u‘xxx’转换为UTF-8 编码的‘xxx'’用encode('utf-8')方法：

>>> u'ABC'.encode('utf-8')
'ABC'
>>> u'中文'.encode('utf-8')
'\xe4\xb8\xad\xe6\x96\x87'

注：英文字符转换后表示的UTF-8的值和Unicode值相等（但占用的存储空间不同），

而中文字符转换后1个Unicode字符将变为3个UTF-8字符，你看到的\xe4就是其中一个字节，因为它的值是228，没有对应的字母可以显示，所以以十六进制显示字节的数值。

B.把UTF-8编码表示的字符串'xxx'转换为Unicode字符串u'xxx'用decode('utf-8')方法：

>>> 'abc'.decode('utf-8')
u'abc'
>>> '\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
u'\u4e2d\u6587'
>>> print '\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
中文

转载于:https://www.cnblogs.com/ppp1314520818/p/7574842.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30889885

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python或者R语言出现中文字体乱码的情况

宁生信

05-24

5886

在用Python和RStudio加载上文链接提供下载的编程代码时，出现提示“Not all characters in E:/a.txt could be decoded using CP936." cp936 的意思是 Codepage 936, 是简体中文的编码。此外，中文字符集编码还包括：Unicode ,GB2312 ,GBK，GB18030，UTF-8等。 U

asci、unicode、utf-8

weixin_34354945的博客

10-31

为什么80%的码农都做不了架构师？>>> ...

参与评论您还未登录，请先登录后发表或查看评论

字符编码方式

weixin_43559498的博客

10-25

4376

一、字符编码方式： 1.ASCII编码：1个字节，8位 2.Unicode编码：2个字节，16位(解决ASCII码位数不够无法表示汉字等问题，即解决乱码问题) 3.UTF-8编码：根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有生僻字才会被编码成4-6个字节(解决Unicode表示字母时的存储空间浪费问题，本着节约精神，出现可变字长编码UTF-8编码，如果传输文本中包含着大量英文字符，用UTF-8编码就能节省空间) 从上面的表格还可以发现，UTF-8编码有一个

R语言——UTF-8各种问题解决方法

热门推荐

snowdroptulip的博客

12-14

5万+

R语言在碰到读UTF-8文件，或者处理UTF-8数据时总是会遇到各种各样的问题，本姑娘也是在碰了n多次壁，被气得吐血好多次之后，终于对这类总结出了一些解决办法： 1. 读UTF-8文件，例如UTF-8格式的csv：最好的处理办法就是： a1=read.table('C:\\test11.csv',sep=',',fileEncoding = 'UTF-8',header = F) 如果使

令人头疼的Python编码问题

罗罗攀

02-22

136

前言你是否在编写Python代码时，老是遇到UnicodeDecodeError/UnicodeEncodeError错误，无从下手。或者是打印一串字符串，确是乱码，搞人心态。别慌，本文将...

字符串和字符编码

徐志的博客

01-09

2422

由于计算机是美国人发明的，因此，最早只有127个字符被编码到计算机里，也就是大小写英文字母、数字和一些符号，这个编码表被称为ASCII编码，比如大写字母A的编码是65，小写字母z的编码是122。但是要处理中文显然一个字节是不够的，至少需要两个字节，而且还不能和ASCII编码冲突，所以，中国制定了GB2312编码，用来把中文编进去。因此，Unicode应运而生。Unicode把所有语言都...

python字符编码教学设计_字符串和编码

weixin_36326243的博客

01-29

354

字符编码我们已经讲过了，字符串也是一种数据类型，但是，字符串比较特殊的是还有一个编码问题。因为计算机只能处理数字，如果要处理文本，就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte)，所以，一个字节能表示的最大的整数就是255(二进制11111111=十进制255)，如果要表示更大的整数，就必须用更多的字节。比如两个字节可以表示的最大整数是65535...

关于python字符编码,Python字符编码及字符串

weixin_32188111的博客

03-27

336

字符编码字符串是一种数据类型，但是字符串比较特殊的是编码问题，计算机只能处理数字，处理文本就需要将文本转换成数字。计算机设计时8bit作为一个字节byte,一个字节能表示的最大整数就是(2^8)-1 255(二进制11111111)，两个字节65535,4个字节4294967295.计算机最初由127个字符被编码到计算机中，包含大小写字母，数字，字符，称作ASCII码但是处理中文至少需要2个字节...

字符编码问题

LFSenior

12-18

2622

1. ASCII 我们需要了解的最早编码是ASCII码。它用7个二进制位来表示，由于那个时期生产的大多数计算机使用8位大小的字节，因此用户不仅可以存放所有可能的ASCII字符，而且有整整一位空余下来。　　不过，仍然需要指出一点，多数人还是姑且认为一个字节就是一个字符，以及一个字符就是8个二进制位，并且只要确保不将字符串从一台计算机移植到另一台计算机，或者说一种以上的语言，那么

基于字符集、字符编码与HTTP编码解码之万象详解

12-26

在日常编写代码过程中，常常会碰到乱码问题，一个典型的情况是浏览网页，如果网站开发者缺少经验，就会带来这种令人头疼的问题。要了解乱码的症结，我们就得从字符集和字符编码说起，先来看看它们到底是什么： 1：...

网页语言编码及asp乱码问题解决方案

01-20

最近公司有一个日文项目，由于之前使用的是自己开发的中文CMS，并没有将语言包分离，在网站建设调试过程中出现了令人头疼的乱码问题。乱码出现的原因由于各个字符编码的储存空间不一样，所以当使用不同的字符读取...

字符编码

Shawn派大星

12-17

1128

引入 1.什么是字符编码就是文字符号与数字的对应表一个字符对应着一个数字文字符号>>-------编码----------->>数字文字符号<<-------解码-----------<<数字 2.为何要研究字符编码为了解决乱码问题因为存取都用一张字符编码表 3.储备知识 计算机三大核心硬件应用程序任何操作硬件的请求都需要向操作系统发起系统调用, 然后又操作系统去操作硬件 1. CPU 2. 内存 3. 硬盘 ps : 计算机三大

Python办公自动化案例（二）：对比两个Excel数据内容并标出不同

衍生星球的博客

09-14

204

在数据处理和分析的日常工作中，我们经常需要比较两个Excel文件的差异。这可能是为了验证数据的一致性、检查数据的准确性，或者在版本控制中追踪更改。手动比较这些文件不仅耗时，而且容易出错。幸运的是，Python的openpyxl库提供了一种自动化这一过程的方法。

蒙特卡罗方法——布丰投针实验近似计算圆周率python代码实现

2301_79376014的博客

09-09

534

蒙特卡罗——布丰实验

Python实现多线程、多进程及协程

qq_42568323的博客

09-09

1115

本文详细介绍了 Python 中多线程、多进程和协程的并发模型及其实现方式，并通过具体场景演示了如何使用面向对象思想实现这些模型。在实际应用中，应根据任务的类型和需求选择合适的并发模型，从而优化程序的性能和资源利用率。本文将详细介绍 Python 中的多线程、多进程和协程的概念及其实现方式，并通过具体场景展示如何在 Python 中使用面向对象的思想实现这些并发模型。接下来，我们通过一个计算密集型任务的示例来演示多进程的实现：计算一系列大数字的阶乘。主程序中创建并启动了多个计算进程，并使用。

Python——俄罗斯方块