1. 元组和集合
1.1 元组
1.1.1 什么是元组(tuple)
1)容器;将()作为容器的标志,里面多个元素用逗号隔开:(元素1,元素2,元素3,…);
2)不可变的(不支持增删改);有序的(支持下标操作);
3)元素:任何数据。
# 空元组
t1 = ()
# 只有一个元素的元组(重点) - 唯一的这个元素后必须加逗号
t2 = (100)
print(t2,type(t2)) # 100 <class 'int'>
t3= (100,)
print(t3,type(t3),len(t3)) # (100,) <class 'tuple'> 1
# 在没有歧义的情况下,元组的()可以省略 - 直接将多个数据用逗号隔开,表示的也是一个元组
t4 = 10,20,30
print(t4) # # (10, 20, 30)
1.1.2 元组就是不可变的列表
列表中除了和可变相关的操作,其他操作元组都支持。
t1 = 10,20,30,10
print(t1[1]) # 20
print(t1.count(10)) # 2
for x in t1:
print(x)
print(15 in t1) # False
print(10 pyin t1) # True
1.2 集合
1.2.1 什么是集合(set)
1)容器;将{}作为容器的标志,里面多个元素用逗号隔开:{元素1,元素2,元素3,…};
2)可变的;无序的;
3)元素的要求:和字典对键的要求一样(不可变的数据;唯一的)。
# 空集合
s1 = set()
print(type(s1),len(s1)) # <class 'set'> 0
# 集合无序
print({1,2,3} == {3,2,1}) # True
# 元素是不可变类型的数据
s2 = {10,'abc',(1,2)}
print(s2) # {'abc', 10, (1, 2)}
# s3 = {10,'abc',[1,2]}
# print(s3) # TypeError: unhashable type: 'list'
# 元素是唯一的 - 去重
s3 = {10,20,30,10,30,20}
print(s3) # {10, 20, 30}
1.2.2 数学集合运算
&(交集)、|(并集)、-(差集)、^(对称差集)、>、<(判断是否是真子集)、<=、>=(判断是否是子集)。
s1 = {1,2,3,4,5,6,7}
s2 = {5,6,7,8,9,10}
# &(交集) - 集合1 & 集合2 - 获取两个集合的公共部分
print(s1 & s2) # {5, 6, 7}
# 集合1 | 集合2 - 合并两个集合
print(s1 | s2) # {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
# 集合1 - 集合2
print(s1 - s2) # {1, 2, 3, 4}
print(s2 - s1) # {8, 9, 10}
# 集合1 ^ 集合2
print(s2 ^ s1) # {1, 2, 3, 4, 8, 9, 10}
# >、< - 判断是否是真子集
# 集合1 > 集合2 - 集合2是否是集合1的真子集
# >=、<= - 判断是否是子集
'''
{1,2,3}
子集:{}、{1}、{2}、{3}、{1,2}、{1,3}、{2,3}、{1,2,3}
真子集:{}、{1}、{2}、{3}、{1,2}、{1,3}、{2,3}
'''
3. 认识字符串
3.1 什么的字符串(str)
1)字符串是容器型数据类型;将’‘、“”、’‘’‘’'、“”“”""作为容器的标志,引号中的每个符号就是字符串的元素;
2)字符串是不可变的;字符串有序(支持下标操作);
3)元素:引号中的每个符号就是字符串的元素,字符串的元素又叫字符。字符又分为普通字符和转义字符两种。
# 1)引号中的每个符号都是字符串的元素,对于符号本身没有限制
str1 = 'abc23胡椒粉和😀❀♥'
new_str1 = str1.upper()
print(new_str1) # ABC23胡椒粉和😀❀♥
# 2)引号问题
str2 = 'abc'
str3 = 'mn123'
str4 = '''abc'''
str5 = """abc"""
print(type(str1),type(str2),type(str3),type(str4),type(str5)) # <class 'str'> <class 'str'> <class 'str'> <class 'str'> <class 'str'>
# 3)多行字符串 - 三个引号开头的字符串,字符串内容可以直接按回车换行
str1 = '''abc
123'''
print(str1)
'''
abc
123
'''
str1 = 'abc' \
'123'
print(str1) # abc123
str1 = 'abc\n123'
print(str1)
'''
abc
123
'''
# 4)空串 - 引号内什么都没有,空格也不行
str1 = ''
print(len(str1),type(str1)) # 0 <class 'str'>
str1 = ' '
print(len(str1),type(str1)) # 1 <class 'str'>
4. 字符和转义字符
4.1 字符
字符:字符串的元素。
4.1.1 普通字符
在字符串中表示符号本身的字符就是普通字符,例如:中文、字母、数字等
4.1.2 转义字符
在特定的符号前加\来表示特殊功能或者特殊意义的符号就是转义字符。
'''
\t - 水平制表符(相当于按一次tab键)
\n - 换行
\' - 表示一个普通的单引号
\" - 表示一个普通的双引号
\\ - 表示一个普通的反斜杠
'''
''
print('\tabc') # abc
print('abc\n123')
'''
abc
123
'''
print('it\'s me') # it's me
print("it's me") # it's me
print("I say:\"you see see,one day day\"") # I say:"you see see,one day day"
print('I say:"you see see,one day day"') # I say:"you see see,one day day"
print('\\abc123') # \abc123
4.2 R语法
字符串的最前面可以加r或者R,让字符串中所有的转义字符功能消失,所有的字符都变成普通字符:r’‘、R’'。
str1 = '\tabc\n123\u4e00'
print(str1)
'''
abc
123一
'''
str1 = r'\tabc\n123\u4e00'
print(str1) # \tabc\n123\u4e00
5. 字符编码
5.1 字符编码
5.1.1 计算机储存原理
计算机保存数据的时候只能存数字,而且存的是数字的补码。
5.1.2 字符编码
为了能够让计算机保存文字符号,我们给每一个符号对应了一个固定数字,在存储符号的时候就保存这个符号对应的数字,那么这个数字就是这个符号的编码值。
5.2 编码表
编码表:保存符号和编码值对应关系的表。
5.2.1 ASCII码表
通过个字节来对128个字符进行编码,里面的字符是美国通用的符号。
数字在大写字母的前面,大写字母在小写字母前面,大写字母和小写字母之间有间隙(A - 65;a - 97)。
5.2.2 Unicode编码表
包含了世界上所有的国家所有的民族所有的语言的符号(万国码)。
1)Unicode编码表是ASCII码表的扩展,它包含ASCII码表;
2)中文编码值范围(十六进制):4e00 ~ 9fa5 。
5.3 python使用编码值
5.3.1 chr函数
chr(编码值) :获取编码值对应的字符。
print(chr(97)) # a
print(chr(65)) # A
# 注意:如果想要在程序中直接使用16进制数,数字前必须加前缀'0x'、'0X'
print(chr(0x4e00)) # 一
# 打印所有中文
count = 0
for x in range(0x4e00,0x9fa5+1):
count += 1
print(chr(x),end=' ')
if count % 40 == 0:
print()
# 打印盲文
count = 0
for x in range(0x2800,0x28FF+1):
count += 1
print(chr(x),end=' ')
if count % 40 == 0:
print()
5.3.2 ord函数
ord(字符):获取指定字符对应的编码值。
print(ord('余'),ord('婷')) # 20313 23159
print(ord('钱')) # 38065
# hex(十进制数) - 获取指定十进制对应的16进制
print(hex(20313),hex(23159)) # 0x4f59 0x5a77
5.3.3 编码字符
在字符串中用’\u4位的16进制数‘来表示一个字符。
str1 = 'a\u0061一\u4e00'
print(str1) # aa一一
x = '看'
# print('一' <= x <= '龥') # True
print('\u4e00' <= x <= '\u9fa5') # True
6. 获取字符
6.1 查
获取元素(字符)。
列表获取元素的方法字符串都支持。
str1 = '\thello world!'
# 注意:一个转义字符长度是1,一个空格的长度也是1
print(str1[2]) # 'e'
print(str1[-1]) # '!'
print(str1[1:4]) # 'hel'
str2 = 'hfhbjfb'
print(str2[1:-1]) # 'fhbjf'
print(str2[1:]) # 'fhbjfb'
str3 = 'abc123'
for x in str3:
print(x)
for index in range(len(str3)):
print(index,str3[index])
for index,item in enumerate(str3):
print(index,item)
6.2 相关操作
6.2.1 +、*
1)字符串1 + 字符串2 - 将两个字符串合并成一个字符串。
str1 = 'hello'
str2 = 'python'
str3 = str1 + str2
print(str3) # 'hellopython'
2)字符串 * N、N * 字符串 - 将N个字符串合并成一个字符串。
print(str1 * 3) # 'hellohellohello'
6.2.2 比较大小
比较大小:>、>=、<、<=。
1)两个字符串比较大小比较的是第一对不相等的字符的编码值的大小;
2)两个字符比较大小就是比较两个字符的编码值的大小。
'''
x是否是数字:'0' <= x <= '9'
x是否是小写字母:'a' <= x <= 'z'
x是否是字母:'a' <= x <= 'z' or 'A' <= x <= 'Z'
x是否是中文:'\u4e00' <= x <= '\u9fa5'
'''
print('abc' < '1234567890') # False
6.2.3 练习
练习1:已知一个字符串,统计字符串中数字字符的个数。
str1 = 'abc1123你好110' # 7
count = 0
for x in str1:
if '0' <= x <= '9':
count += 1
print(count)
练习2:已知一个字符串,提取字符串中所有的中文字符。
str1 = 'ab啊c1123你好110是-2=2' # '啊你好是'
new_str1 = ''
for x in str1:
if '\u4e00' <= x <= '\u9fa5':
new_str1 += x
print(str(new_str1))
6.3 in 和 not in
字符串1 in 字符串2:判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)。
# 'abc'的子串:''、'a'、'b'、'ab'、'bc'、'abc'
print('a' in 'abc') # True
print('ab' in 'abc') # True
print('ac' in 'abc') # False
7. 作业
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入’abcd1234 ’ 输出’bd24’
str1 = 'abcd1234 ' new_str1 = '' for index,item in enumerate(str1): if index % 2: new_str1 += item print(new_str1)
-
输入用户名,判断用户名是否合法(用户名长度6~10位)
user_name = input('请输入用户名:') if 6<= len(user_name) <= 10: print('用户名合法') else: print('用户名不合法')
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
user_name = input('请输入用户名:') for x in user_name: if not ('0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z'): print('用户名不合法') break else: print('用户名合法')
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
user_name = input('请输入用户名:') for x in user_name: if not ('A' <= user_name[0] <= 'Z'): print('用户名不合法') break elif not ('0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z'): print('用户名不合法') break else: print('用户名合法')
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:‘123992’
str1 = 'abc1shj23kls99+2kkk' new_str1 = '' for x in str1: if '0' <= x <= '9': new_str1 += x print(new_str1)
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 ‘A2H2KLM12+’
# 方法1: str1 = 'a2h2klm12+' print(str1.upper()) # 方法2: str1 = 'a2h2klm12+' new_str1 = '' for x in str1: if 'a' <= x <= 'z': new_str1 += chr(ord(x) - 32) else: new_str1 += x print(new_str1)
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
num = input('请输入一个小于1000的数字:') print('py1901' + num.zfill(3))
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**‘===’** 输出:3
str1 = 'anc2+93-sj胡说' count = 0 for x in str1: if not('0' <= x <= '9' or 'A' <= x <= 'Z' or 'a' <= x <= 'z'): count += 1 print(count)
-
输入字符串,将字符串的开头和结尾变成’+',产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+'**
str1 = 'abc123' print(str1.center(len(str1)+2,'+'))
-
输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
str1 = 'abc1234' x = len(str1) if x % 2: print(str1[x//2]) else: print(str1[x//2-1],str1[x//2])
-
写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str1 = 'how are you? Im fine, Thank you!' str2 = 'you' for x in range(0,len(str1)): if str1[x] == str2[0]: if str1[x:x + len(str2)] == str2: print(x) break
-
获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str1 = 'abc123' str2 = 'huak3' str3 = '' for x in str1: if x in str2: str3 += x print(str3)
you, 打印8
```python
str1 = 'how are you? Im fine, Thank you!'
str2 = 'you'
for x in range(0,len(str1)):
if str1[x] == str2[0]:
if str1[x:x + len(str2)] == str2:
print(x)
break
```
-
获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str1 = 'abc123' str2 = 'huak3' str3 = '' for x in str1: if x in str2: str3 += x print(str3)