七.元组
-
元组
- 不可变序列,使用小括号()进行定义 ;
- 元组中存储的是对象的引用,若元组中的对象是可变对象,则可变对象的引用不允许改变,但数据可以改变,若元组中的对象是不可变对象,则不能再引用其他对象
- 可向元组中的列表中增加元素,如
a=(1,2,[4,5]) a[2].append(55) print(a)
输出
(1, 2, [4, 5, 55])
-
元组的创建方式
- 直接使用小括号:
元组名=(元素对象,元素对象,元…) - 使用内置函数tuple():
元组名=tuple((元素对象,元素对象,元素对象…)) - 只包含一个元组的元素需要使用逗号和小括号
元组名=(元素对象,) - 空元组:元组名=() 或 元组名=tuple()
- 直接使用小括号:
-
为什么将元组设计为不可变序列
在多任务环境下,同时操作元组对象时不需要加锁;因此,在程序中尽量使用不可变序列 -
获取元组中元素
获取元组中元素可使用索引
元组名[索引] -
元组的遍历
元组是可迭代对象,可用for–in进行遍历
八.集合
-
集合
- 集合是python语言提供的内置数据结构
- 是可变序列
- 集合是没有value的字典(无序)
-
集合的创建方式
- 直接{} 如 a={1,2,3}
- 使用内置函数set() :可将列表、元组、字符串、集合转成集合中的元素
- 定义空集合:集合=set()
如seta=set('python')
-
集合的相关操作
使用in 和 not in 判断集合中是否存在相关元素 -
集合元素的新增
- 使用add()方法,一次添加一个元素
- 使用update()方法至少添加一个元素
集合名.update(元素,元素…)
-
集合元素的删除
- remove() 一次删除一个指定元素,若指定元素不存在则抛出KeyError
- discard() 一次删除一个指定元素,若指定元素不存在则不抛异常
- pop() 一次删除一个任意元素,不能指定参数
- clear() 清空集合
-
集合间的关系
- 两个集合是否相等:使用==或!=进行判断
- 一个集合是否是另一个集合的子集,调用issubset进行判断
- 一个集合是否是另一个集合的超集,调用issuperset;
- 两个集合是否没有交集,调用isdisjoint
-
集合的数学操作
设两集合分别为a和b- 交集:
print(a.intersection(b)) 或 print(a&b) - 并集:
print(a.union(b)) 或 print(a|b) - 差集(a中有但b中没有的):
print(a.difference(b)) 或 print(a-b) - 对称差集(a和b中去除交集后的集合):
print(a.symmetric_difference(b)) 或 print(a^b)
- 交集:
-
集合生成式
将列表生成式中的[]改成{}就ok
集合名={生成集合元素的表达式 for 自定义变量 in range(start,stop,step)}
九.字符串
-
字符串
python中的基本数据类型,是不可变的字符序列;使用单、双、三引号定义 -
字符串的驻留机制
仅保存一份相同且不可变字符串的方法,对相同的字符串只保留一份拷贝 -
符合驻留机制的几种情况(交互模式)
- 字符串的长度为0或1时;符合标识符的字符串(含字母、数字、下划线);
- 字符串只在编译时进行驻留,而非运行时;
- [-5,256]之间的整数数字
- pycharm对字符串进行了优化处理,字符串都符合驻留机制
- 若要使字符串强行驻留,使用sys中的intern方法
import sys stra=sys.intern(stra) #stra为字符串名
- 需要进行字符串拼接时使用str类型的join方法,而非+,效率高
-
字符串的查询操作
- index()和find()查找子串第一次出现的位置
- rindex()和rfind()查找子串最后一次出现的位置
- 若查找的子串不存在,index()和rindex()抛出ValueError,find()和rfind()返回-1
举例:
a='hello,hello' print(a.index('lo'))
输出3
-
字符串的大小写转换操作的方法
- upper()所有字符转成大写
- lower()所有字符转成小写
- swapcase()把字符串中所有字符大小写颠倒;
- capitalize()把第一个字符转成大写,其余小写
- title()把每个单词的第一个字符转换成大写,其余小写
举例:
a='hello,world,python' b=a.title() print(b)
输出
Hello,World,Python
-
字符串内容对齐的方法
- center()居中对齐
- ljust()左对齐
- rjust()右对齐
- 括号内第一个参数指定宽度,第二个字符指定填充符(非str要加引号),默认空格,若设置宽度小于实际宽度则返回原字符串
- zfill()右对齐,该方法指定一个参数宽度,用0填充;若有负号,0填充到负号后
-
字符串的劈分
- split()从字符串的左边开始劈分
- rsplit()从字符串的右边开始劈分
- 若未指定最大劈分次数,这两种方法效果一样
注: - 默认劈分字符是空格,返回值是一个列表
- 通过参数sep指定劈分符
- 通过参数maxsplit指定最大劈分次数,超过最大劈分次数后,剩余的子串单独作为一部分
a='hello,hello,wwwww,起飞' print(a.split(sep=',',maxsplit=2))
输出
['hello', 'hello', 'wwwww,起飞']
-
字符串的判断方法
- isidentifier()判断指定的字符串是不是合法的标识符
- isspace()判断指定字符串是否全部由空白字符组成(回车、换行、水平制表符)
- isalpha()判断指定字符串是否全部由字母组成(汉字也算字母)
- isdecimal()判断指定字符串是否全部由十进制的数字组成(罗马数字不算十进制数字)
- isnumeric()判断指定字符串是否全部由数字组成
- isalnum()判断指定字符串是否全部由字母和数字组成
-
字符串的替换与合并
- replace()第一个参数指定被替换的字符;第二个参数指定替换字符的字符串,该方法返回替换后的字符串,替换前的字符串不发生改变;第三个参数指定最大替换次数
举例:
a='hello,python,python' print(a.replace('python','java',1))
输出
hello,java,python
- join()将列表或元组或字符串序列中的字符串合并成一个字符串
举例:
lst=['java','python',str(255)] print('|'.join(lst))
输出
java|python|255
输出
javapython255
print('*'.join('python'))
输出
p*y*t*h*o*n
- replace()第一个参数指定被替换的字符;第二个参数指定替换字符的字符串,该方法返回替换后的字符串,替换前的字符串不发生改变;第三个参数指定最大替换次数
-
字符串的比较操作
- 运算符:> >= < <= == !=
- 比较规则:首先比较两个字符串的第一个字符,如果相等则比较下一个,依次比较直到字符不相等
- 比较原理:比较的是字符的ordinal value(原始值),调用内置函数ord可以得到,与ord对应的是内置函数chr,调用chr时指定原始值可以得到对应字符
(ord只能用来获得单个字符的编码) - ==比较的是value is比较的是id
-
字符串的切片操作
字符串的是不可变类型,切片操作将产生新的对象
[start:stop:step]
举例a='hello,python' print(a[::-1]) #start默认为0,stop若不写,默认为最后一个元素(包括它)
输出
nohtyp,olleh
-
格式化字符串
-
%作占位符
举例:print('我叫%s,今年%d岁' % (name,age))
%d整数 %f浮点数 %s字符串 %x十六进制整数 %%表示% (如果不确定用什么,就用%s)
可指定宽度和精度:举例:print(‘%10.3f’ % 3.1415926) 返回3.142 # 格式为 %宽度.精度 -
{}作占位符
举例:print('我的名字是{0},今年{1}岁,我真的是{0}'.format(name,age))
{}中填写format()中的占位符顺序,name和age是自定义变量名
索引从0开始 -
指定宽度和精度
举例:print('{0:10.3}'.format(3.1415926))
输出
3.142
格式为 {占位符顺序:宽度.精度},- 若想要居中输出,在宽度前加^,右对齐,在宽度前加>
- 若想要指定宽度补0,在宽度前面加0,填充符写在宽度前
-
f格式化
举例:print(f'我叫{name},今年{age}岁')
-
-
字符串的编码与解码
- 编码
将字符串转换为二进制数据(bytes):
输出a='你是人间理想' byte=a.encode(encoding='GBK') print(byte)
b'\xc4\xe3\xca\xc7\xc8\xcb\xbc\xe4\xc0\xed\xcf\xeb'
在GBK编码格式中,一个中文占两个字节;在UTF-8编码格式中,一个中文占三个字节 - 解码
将bytes类型的数据转换成字符串类型:
输出:print(byte.decode(encoding='GBK'))
你是人间理想
byte为解码返回的结果
编码和解码所用的编码格式必须相同 - utf-8
在代码中加如下代码
-*- coding: utf-8 -*-
es类型的数据转换成字符串类型:
输出:print(byte.decode(encoding='GBK'))
你是人间理想
byte为解码返回的结果
编码和解码所用的编码格式必须相同 - utf-8
在代码中加如下代码
-*- coding: utf-8 -*-
注释后文件就会使用utf-8解码
- 编码