元组集合和字符串
元组和集合
1.元组
1)什么是元组
容器; 将()作为容器的标志,里面多个元素用逗号隔开:(元素1, 元素2, 元素3, …)
不可变的(不支持增删改); 有序的(直接下标操作)
元素:任何数据
空元组
t1 = ()
只有一个元素的元组(重点!) - 唯一的这个元素后面必须加逗号
t2 = (100,)
print(t2, type(t2), len(t2))
在没有歧义的情况下,元组的()可以省略 - 直接将多个数据用逗号隔开,表示的也是一个元组
t3 = 10, 20, 30 * 3
print(t3)
2) 元组就是不可变的列表
列表中除了和可变相关的操作,其他操作元组都支持
2.集合
1) 什么是集合(set)
容器;将{}作为容器的标志,里面多个元素用逗号隔开:{元素1, 元素2, 元素3,…}
可变的;无序的
元素的要求:和字典对键的要求一样(不可变的数据; 唯一的)
空集合
s1 = set()
print(type(s1), len(s1))
集合无序
print({1, 2, 3} == {3, 1, 2}) # True
元素是不可变类型的数据
s2 = {10, 'abc', (1, 2)}
print(s2)
s3 = {10, 'abc', [1, 2]} # 报错!
元素是唯一的 - 去重
s3 = {10, 20, 10, 10, 30, 20}
print(s3) # {10, 20, 30}
2)数学集合运算:&(交集)、|(并集)、-(差集)、^(对称差集)、>、<、>=、<=
s1 = {1, 2, 3, 4, 5, 6, 7}
s2 = {5, 6, 7, 8, 9, 10}
# &(交集) - 集合1 & 集合2 - 获取两个集合的公共部分
print(s1 & s2) # {5, 6, 7}
# 集合1 | 集合2 - 合并两个集合
print(s1 | s2) # {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
# 集合1 - 集合2
print(s1 - s2) # {1, 2, 3, 4}
print(s2 - s1) # {8, 9, 10}
# 集合1 ^ 集合2
print(s1 ^ s2) # {1, 2, 3, 4, 8, 9, 10}
{1, 2, 3}
子集:{}、{1}, {2}, {3}、{1, 2}、{1, 3}、{2, 3}、{1, 2, 3}
真子集:{}、{1}, {2}, {3}、{1, 2}、{1, 3}、{2, 3}
、< - 判断是否是真子集
集合1 > 集合2 - 集合2是否是集合1的真子集
=、<= - 判断是否是子集
认识字符串
1. 什么是字符串(str)
字符串是容器型数据类型;将’‘、“”、’‘’‘’'、“”“”""作为容器的标志,引号中的每个符号就是字符串的元素
字符串是不可变的;字符串有序(支持下标操作)
元素:引号中的每个符号就是字符串的元素,字符串的元素又叫字符。字符分为普通字符和转义字符两种
1) 引号中的每个符号都是字符串的元素,对于符号本身没有限制
str1 = 'abc23红色经典mn*……😁❀♥'
2) 引号问题
str2 = 'abc'
str3 = "abc"
str4 = '''abc'''
str5 = """abc"""
print(type(str2), type(str3), type(str4), type(str5)) # <class 'str'> <class 'str'> <class 'str'> <class 'str'>
3)多行字符串 - 三个引号开头的字符串,字符串内容可以直接按回车换行
str1 = '''abc
123
MN'''
print(str1)
str1 = 'abc\n123\nMN'
print(str1)
4)空串
str1 = ''
# str1 = ""
print(len(str1), type(str1))
字符和转移字符
1. 字符 - 字符串的元素
1)普通字符 - 在字符串中表示符号本身的字符就是普通字符,例如:中文、字母、数字等
2)转义字符 - 在特定的符号前加\来表示特殊功能或者特殊意义的符号就是转义字符
\t - 水平制表符(相当于按一个tab键)
\n - 换行
’ - 表示一个普通的单引号
" - 表示一个普通的双引号
\ - 表示一个普通的反斜杠
print('\tabc\n123')
print('it\'s me') # it's me
print("it's me") # it's me
print("I say:\"you see see, one day day\"") # I say:"you see see, one day day"
print('I say:"you see see, one day day"') # I say:"you see see, one day day"
print('\\tabc\n123')
2. R语法
字符串的最前面可以加r或者R,让字符串中所有的转义字符功能消失,所有的符号都变成普通字符: r’‘、R’’
str1 = R'\tabc\n123\u4e00'
print(str1)
path = r'C:\users\yuting\name\test\demo\a.txt'
print(path)
字符编码
1. 字符编码
计算机存储原理:计算机保存数据的时候只能存数字,而且存的是数字的补码
字符编码:为了能够让计算机保存文字符号,我们给每一个符号对应了一个固定数字,在存储符号的时候就保存这个符号对应的数字,那么这个数字就是这个符号的编码值
2.编码表 - 保存符号和编码值对应关系的表
-
ASCII码表: 通过一个字节来对128个字符进行编码,里面的字符是美国通用的符号。
数字在大写字母的前面、大写字母在小写字母前面、大写字母和小写字母之间有间隙(A - 65; a - 97) -
Unicode编码表(python): 包含了世界上所有的国家所有民族的所有的语言的符号(万国码)
a. Unicode编码表是ASCII码表的扩展,它包含ASCII码表
b. 中文编码值范围(16进制):4e00 ~ 9fa5
3.python使用编码值
1) chr函数: chr(编码值) - 获取编码值对应的字符
print(chr(97)) # a
print(chr(65)) # A
# 注意:如果想要在程序中直接使用16进制数,数字前必须加前缀'0x'、'0X'
print(chr(0x4e00)) # 一
# 打印所有中文
count = 0
for x in range(0x4e00, 0x9fa5+1):
count += 1
print(chr(x), end=' ')
if count % 40 == 0:
print()
2)ord函数: ord(字符) - 获取指定字符对应的编码值
print(ord('余'), ord('婷')) # 20313 23159
print(ord('钱')) # 38065
# hex(十进制数) - 获取指定十进制对应的16进制
print(hex(20313), hex(23159)) # 0x4f59 0x5a77
3)编码字符: 在字符串中用’\u4位的16进制编码值’来表示一个字符
str1 = 'a\u0061一\u4e00'
print(str1)
# 判断x是否是中文
x = '9'
# print('一' <= x <= '龥')
print('\u4e00' <= x <= '\u9fa5')
获取字符
1. 查 - 获取元素(字符)
# 列表获取元素的方法字符串都支持
str1 = '\thello world!'
# 注意:一个转义字符长度是1,一个空格的长度也是1
print(str1[2]) # 'e'
print(str1[-1]) # '!'
print(str1[1:4]) # 'hel'
str2 = 'hajsks'
print(str2[1:-1]) # 'ajsk'
print(str2[1:]) # 'ajsks'
print('------------------------------------华丽的分割线-----------------------------------')
str3 = 'abc123'
for x in str3:
print(x)
print('------------------------------------华丽的分割线-----------------------------------')
for index in range(len(str3)):
print(index, str3[index])
print('------------------------------------华丽的分割线-----------------------------------')
for index, item in enumerate(str3):
print(index, item)
2. 相关操作
1) +、*
# 字符串1 + 字符串2 - 将两个字符串合并成一个字符串
str1 = 'hello'
str2 = 'python'
str3 = str1 + str2
print(str3) # 'hellopython'
# 字符串 * N 、 N * 字符串 - 将N个字符串合并成一个字符
print(str1 * 3) # 'hellohellohello'
2) 比较大小: >、>=、<=、<
两个字符串比较大小比较的是第一对不相等的字符的编码值的大小
两个字符比较大小就是比较两个字符的编码值的大小
x是否是数字:‘0’ <= x <= ‘9’
x是否是小写字母:‘a’ <= x <= ‘z’
x是否是字母:‘a’ <= x <= ‘z’ or ‘A’ <= x <= ‘Z’
x是否是中文:‘\u4e00’ <= x <= ‘\u9fa5’
print('abc' < 'K234567890') # False
# 练习1:已知一个字符串,统计字符串中数字字符的个数
str1 = 'abc1123你好110' # 7
count = 0
for x in str1:
if '0' <= x <= '9':
count += 1
print(count)
# 练习2:已知一个字符串,提取字符串中所有的中文字符
str1 = 'ab啊c1123你好110是-2=2' # '啊你好是'
new_str = ''
for x in str1:
if '\u4e00' <= x <= '\u9fa5':
new_str += x
print(new_str) # '啊你好是'
3) in 和 not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
'abc’的字串: ‘’、‘a’、‘b’、‘c’、‘ab’、‘bc’、‘abc’
print('a' in 'abc') # True
print('ab' in 'abc') # True
print('ac' in 'abc') # False
作业
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入’abcd1234 ’ 输出’bd24’
str1 = '123456789' print(str1[1::2])
-
输入用户名,判断用户名是否合法(用户名长度6~10位)
use_name = '123qwe12341' if 6 <= len(use_name) <= 10: print('该用户名合法') else: print('该用户名不合法')
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
use_name = '123qwe·' count = 0 count1 = 0 for i in use_name: if '0' <= i <= '9' or 'a' <= i <= 'z' or 'A' <= i <= 'Z': count += 1 else: count1 += 1 if count1 != 0: print('不合法') else: print('合法')
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
use_name = 'q1=weADDF' nums = 0 letter = 0 other = 0 if 'A' <= use_name[0] <= 'Z': for i in use_name[1:]: if '0' <= i <= '9': nums += 1 elif 'a' <= i <= 'z' or 'A' <= i <= 'Z': letter += 1 else: other += 1 if nums != 0 and letter != 0 and other == 0: print('该用户名合法') else: print('该用户名不合法') else: print('该用户名不合法')
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:‘123992’
str1 = 'abc1shj23kls99+2kkk' str2 = '' for i in str1: if '0'<= i <= '9': str2 += i print(str2)
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 ‘A2H2KLM12+’
#方法1: str1 = 'a2h2klm12+' str2 = str1.upper() print(str2) #方法2: str3 = '' for i in str1: if 'a' <= i <= 'z': str3 += chr(ord(i) - 32) else: str3 += i print(str3)
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
nums = 1231 if 0 <= nums <= 9: print(f'py190100{nums}') elif 10 <= nums <= 99: print(f'py19010{nums}') elif 100 <= nums <= 999: print(f'py1901{nums}') elif nums >999: print('输入错误,请重新输入')
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**‘===’** 输出:3
str1 = '===' count = 0 count1 = 0 for i in str1: count1 += 1 if '0' <= i <= '9': count += 1 elif 'a' <= i <= 'z' or 'A' <= i <= 'Z': count += 1 print(count1 - count)
-
输入字符串,将字符串的开头和结尾变成’+',产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+'**
str1 = 'abc123' str2 = str1.replace(str1[0],'+') str3 = str2.replace(str1[-1],'+') print(str3)
-
输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
str1 = 'abc1234' if len(str1) % 2 == 0: i = str1[(len(str1) // 2) - 1] j = str1[len(str1) // 2] str2 = i + j else: str2 = str1[len(str1) // 2] print(str2)
-
写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str1 = 'how are you? Im fine, Thank you!' str2 = 'you' count = 0 for i in range(1,9): str3 = str1[i:] if str2 not in str3: break else: count += 1 print(count)
-
获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3