第8章字符串与Unicode

壹如年少遲夏歸

于 2022-11-22 18:32:41 发布

阅读量149

点赞数

分类专栏： python高级编程文章标签： python github 开发语言

本文链接：https://blog.csdn.net/qq_32444571/article/details/127987821

版权

python高级编程专栏收录该内容

11 篇文章 0 订阅

订阅专栏

08 字符串与Unicode

8.1 文本字符串与字节字符串

数据一致以字节方式存储；Unicode 使用4个字节来表示每个字符

两种不同的字符串

用于存储文本
存储原始字节

# str 包含一个 encode() 方法 返回 bytes
text_str = "The quick brown fox jumped over the lay dogs."
print(type(text_str))
print(text_str.encode("utf-8"))

# bytes 实例 包含一个decode() 方法 返回 str
text_str = b"The quick brown fox jumped over the lay dogs."
print(type(text_str))
print(text_str.decode("utf-8"))

six 模块是一个以编写能够正确运行在python2 和python3下的模块为中心的类库
- 文本字符串类的别名six.text_type
- 字节字符串类的别名six.binary_type

8.2包含非ASCII字符的字符串

文本字符串的repr人类可读的汉字，而字节字符串的repr是机器可读的；二者长度也不相同

text_str = "你好，"
byte_str = text_str.encode("utf-8") 
# 占位字符
new_text_str = text_str.encode("ascii", "replace")
print(len(text_str))  # 3
print(byte_str)  # b'\xe4\xbd\xa0\xe5\xa5\xbd\xef\xbc\x8c'
print(len(byte_str))  # 9

获取基于底层的首选编码

import locale

print(locale.getpreferredencoding())  # cp936

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

壹如年少遲夏歸

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

字符串和unicode互相转换

忆丶荒年

05-25

1330

字符串转换unicode和unicode 转字符串两个方法希望可以帮到你。/** * 字符串转换unicode */ public static String StringToUnicode(String string) { StringBuffer unicode = new StringBuffer(); for (int i = 0;

Python(19)-字符串、Unicode字符串

sinat_40624829的博客

06-19

263

高级数据类型--字符串1字符串的定义2字符串的长度、计数、Index3字符串常用方法3.1判断类型3.2查找和替换3.3文本对齐3.4去除空白字符4字符串的拆分和拼接5字符串的切片 1字符串的定义 字符串用于存储多个字符，可以用单引号和双引号来定义字符串，大多数编程语言都是使用双引号，为了和其他语言接轨，建议使用双引号进行字符串定义。 str1=“python” 使用单引号定义字符串的情形：字...

参与评论您还未登录，请先登录后发表或查看评论

在Unicode和普通字符串之间转换

weixin_30681615的博客

11-26

116

2008-04-20 02:04:51 by deepblue 原文出处：http://group.movo.tv/m8/circlediarylook/S4028808a148b0dec01148b9d5e4c02e4.html 1.1. 问题 Problem You need to deal with data that doesn't fit in the ASCII charac...

Unicode字符串和非Unicode字符串

代码帮

07-30

1万+

什么是Unicode？ Unicode（统一码、万国码、单一码）是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。 字符串？ 字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an...

python 中的unicode与字符串

cjneo的专栏

11-05

3086

python中的str类型和unicode类型是两种不同的类型怎么看呢一个变量 type(val)就能看到它的所属类型有时候从数据库中取出数据，直接print出来： "u/u123" 这就表明它是unicode unicode是python中的内部编码，也就是说很多时候python的内部表示都用它来编码所以有decode encode函数我们用u表

str字符和unicode字符的区别

mycar001的博客

10-27

4063

实际情况是，beautifulsoup处理后的网页，的确是utf-8的。而utf-8和unicode，本身就不相等。首先，字符串分两种，一种是str字符，一种是unicode字符。str字符，就是普通字符，某种编码的字符，包括ANSI，GBK，UTF-8等，而Unicode就是原始的unicode，未经过encode编码的unicode，而进过某种编码，比如utf-8，gbk等编码后的unic

Python原始字符串与Unicode字符串操作符用法实例分析

01-21

本文实例讲述了Python原始字符串与Unicode字符串操作符用法。分享给大家供大家参考，具体如下： #coding=utf8 ''''' 在原始字符串里，所有的字符串都是直接按照字面的意思来使用，没有转义特殊或不能打印的字符。 ...

js实现unicode码字符串与utf8字节数据互转详解

10-17

在讨论如何使用JavaScript实现Unicode码字符串与UTF-8字节数据互转之前，需要先了解一些基础概念。Unicode是一种国际标准编码系统，旨在为世界上所有的字符提供唯一的编码，而UTF-8是Unicode转换格式之一，是一种...

JS 文字符串转换unicode编码函数

10-29

此外，由于服务器端接收到经过AJAX传递的字符串时，通常需要进行第二次转码，以保证编码的统一和兼容性，因此服务器端需要将得到的字符串转换成UTF-8编码。让我们首先来讨论uniencode()函数的工作机制。该函数首先...

第5章 字符串与正则表达式.pptx

03-22

字符串可以是 Unicode 码、UTF-8 码等多种编码方式。在本章节中，我们将介绍字符串的编码、索引、分片、连接操作、逻辑操作和正则表达式的应用。 5.1 字符串编码 Unicode 码是为表达全世界所有语言的任意字符而...

深入理解——字节、字符/字符串、Unicode 字符集

抱朴守拙

12-02

6452

1 字符编码 1、字符内码：字符内码(charcter code)指的是用来代表字符的内码.读者在输入和存储文档时都要使用内码。 ASCII 码（单字节内码）：能够支持256个字符编码. ANSI（双字节内码）：能够支持65000个字符编码，中文简体编码 GB2312 实际上是 ANSI 的一个代码页，不同的代码页的内码无法再其他代码中正常显示，日中文/繁体中文/简体中文使用了不同的代码页...

Unicode和字符串处理

Leo的博客

03-19

1万+

我们熟悉的ASCII码全称是美国国家信息交换标准码，它起源于20世纪50年代末，并于1967年最终定型。ASCIIS码使用7位（bit）的宽度，有26个小写字母，26个大写字母，10个数字，32个符号，33个控制码，一个空格码，共128个代码。 ASCII的使用相当普及，是一种非常可靠的标准。但是，ASCII是一个真正的美国标准，它甚至满足不了其他英语国家的需求，例如，ASCII码并

Python——str字符串和unicode字符串

热门推荐

CodeTutor

07-18

4万+

对于处理过中文的Python程序员来说，想必被UnicodeEncodeError和UnicodeDecodeError并不陌生。为了更好的理解Python中的编码问题，我们首先介绍一下字符编码以及Python的两种字符串类型：str和unicode之间的区别。字符编码我们在编辑器中输入的文字，对用户来说是可读的。但是机器只能读懂01串，那怎么把我们方便阅读的符号转换成机器能读懂的01串呢？这就需要

字符与字符串的表示（ASCII字符，Unicode码，字符串）

夜空

03-13

1万+

非数值数据，通常指的是字符、字符串、图形符号、汉字等数据，它们并不用来表示数值的大小，一般情况下也不对它们进行算术运算。 1. ASCII字符由于计算机内部只能识别和处理二进制代码，所以字符必须按照一定的规则用一组二进制编码来表示。字符编码方式有很多种，美国国家标准局（ANSI）制定的ASCII（American Standard Code for Information Interch

字符串和Unicode编码的相互转换

大梦几千秋的博客

07-28

5586

字符串和Unicode编码的相互转换 1、Unicode编码转字符串 public static String unicodeToString(String unicode) { StringBuffer string = new StringBuffer(); //以\u切割 String[] hex = unicode.split("\\\\u"); for (int i = 1; i < hex.length; i++)

python中str字符串和unicode对象字符串的拼接问题

不眠旅行

01-13

6371

str字符串 s = '中文' # s: s是个str对象，中文字符串。存储方式是字节码。字节码是怎么存的：如果这行代码在python解释器中输入&运行，那么s的格式就是解释器的编码格式；如果这行代码是在源码文件中写入、保存然后执行，那么解释器载入代码时就将s初始化为文件指定编码(比如py文件开头那行的utf-8)； unicode对象字符串 unicode是一种编码

【Python】字符串与unicode字符之间的转换

诗与浪子的博客

08-07

5152

unicode字符串的转换

ANSI和UNICODE字符串处理常用函数

深之JohnChen的专栏

05-30

4131

ANSI和UNICODE字符串处理函数在windows中ANSI和UNICODE字符串操作分别提供了相应的函数，也提供了一套兼容两者的函数。比如： #ifdef UNICODE #define _tcscpy wcscpy #else #define _tcscpy strcpy #endif 字符串处理函数常用函数对照 ANSI UNIC...

ANSI和UNICODE字符串处理函数

邓学彬(泪闯天涯)的专栏

09-16

1万+

VC++中常用的字符串处理函数介绍，分ANSI和UNICODE版本

C#深入解析：字符与字符串操作

"第8章操作字符和字符串.ppt" 在C#编程语言中，字符和字符串是两个至关重要的数据类型，用于处理文本信息。本章主要探讨字符和字符串的详细操作，包括它们的使用、比较、编码以及各种操作方法。首先，字符（Char...