Python语言基础(三)_字符串和编码

最新推荐文章于 2024-08-10 06:37:46 发布

UltimateLove

最新推荐文章于 2024-08-10 06:37:46 发布

阅读量3k

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/sx341125/article/details/52541948

版权

4 篇文章 0 订阅

订阅专栏

计算机内存中的编码格式都是Unicode，所以我们看到的浏览器前端都是服务器转换Unicode字符为UTF-8格式传递过来的，网页源码包括<meta charset="UTF-8"/>

Python3中的字符串也是Unicode编码；

1.ord()函数获取字符的整数表示:
>>>ord('A') 65

2.chr()函数则把编码转换为字符表示：
>>>chr(65) 'A'

1.Python对bytes类型的数据用带b前缀的单引号或双引号表示:
x=b'ABC'

2.以Unicode表示的str通过encode()方法可以编码为指定的bytes:

这里写图片描述

可以明显看到，中文使用encode()方法根据ASCII码转换为bytes时是失败的！

>>> b'ABC'.decode('ascii') 'ABC'
>>>b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8') '中文'

字符串计算多少个字符使用函数len();如果参数是bytes，那么计算的是bytes的字节数

由于Python源代码也是一个文本文件，所以，当你的源代码中包含中文的时候，在保存源代码时，就需要务必指定保存为UTF-8编码。当Python解释器读取源代码时，为了让它按UTF-8编码读取，我们通常在文件开头写上这两行：

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

第一行注释是为了告诉Linux/OS X系统，这是一个Python可执行程序，Windows系统会忽略这个注释；

第二行注释是为了告诉Python解释器，按照UTF-8编码读取源代码，否则，你在源代码中写的中文输出可能会有乱码。

Python中的字符串格式化方式是使用%符号

>>> 'Hello, %s' % 'world' 'Hello, world'
>>>'Hi, %s, you have $%d.' % ('Michael', 1000000) 'Hi, Michael, you have $1000000.'

在字符串内部，%s表示用字符串替换，%d表示用整数替换，有几个%?占位符，后面就跟几个变量或者值，顺序要对应好。如果只有一个%?，括号可以省略。

格式化整数和浮点数还可以指定是否补0和整数与小数的位数

>>>'%2d-%02d' % (3, 1) ' 3-01'
>>>'%.2f' % 3.1415926 '3.14'

3前面是存在一个空格的占位符的；

而%s可以将任何数据类型转换为字符串 ;

如果%本身是个需要显示的符号，那么使用两个%%~

关注

专栏目录