python学习day09
一、集合
1.什么是集合(set)
集合是容器型数据类型;将{}作为容器的标志;
里面多个元素用逗号隔开:{元素1, 元素2, 元素3, …}
可变的,无序
元素的要求:
a.不可变类型的数据
b.元素是唯一的(自动去重)
# 空集合
s1 = set()
print(len(s1), type(s1)) # 0 <class 'set'>
# 集合无序
print({10, 20, 30} == {20, 10, 30}) # True
# 元素是不可变类型的数据
s2 = {10, 'abc', 23.9, (1,2)}
print(s2)
s3 = {10, 'abc', [10, 20]}
print(s3) # 'list' 0 <class 'set'>
# 元素是唯一的
s4 = {10, 20, 45, 12, 10, 10, 12}
print(s4) # {10, 12, 20, 45}
2.增删改查(了解)
1.查 - 只能遍历
s4 = {10, 20, 45, 12, 10, 10, 12}
for i in s4:
print('i:', i)
2.增
集合.add(元素) - 将元素添加到集合中
s4 = {10, 20, 45, 12, 10, 10, 12}
s4.add(1104)
print(s4) # {10, 12, 20, 45, 1104}
3.删
集合.remove(元素) - 删除指定元素,元素不存在会报错
集合.discard(元素) - 删除指定元素,元素不存在不报错
s4 = {10, 20, 45, 12, 10, 10, 12}
s4.remove(10)
print(s4) #
s4.discard(56)
print(s4)
s4.discard(200)
s4.remove(200) # 报错!
4.改 - 没有改的语法,如果要改就删除旧的,添加新的
二、数学集合运算
python中的集合支持的数学集合运算:
并集(|),交集(&),差集(-),对称差集(^),子集(>=、<=)、真子集(<、>)
A = {1, 2, 3, 4, 5, 6, 7}
B = {5, 6, 7, 8, 9}
# 1.并集
print(A | B) # {1, 2, 3, 4, 5, 6, 7, 8, 9}
# 2.交集(&)
print(A & B) # {5, 6, 7}
# 3.差集(-)
print(A - B) # {1, 2, 3, 4}
print(B - A) # {8, 9}
# 对称差集(^)
print(A ^ B) # {1, 2, 3, 4, 8, 9}
# {1, 2}的子集有:{}、{1}、{2}、{1, 2} - <=、>=
集合1 <= 集合2
集合1 >= 集合2
{1, 2}真子集:{}、{1}、{2} - <、>
集合1 < 集合2
集合1 > 集合2
三、认识字符串
1.什么是字符串(str)
字符串是容器型数据类型;
将’’、""、’’’’’’、""""""作为容器的标志,里面的每一个符号就是它的一个元素
字符串不可变;字符串有序
字符串元素:引号中的每一个符号都是字符串的元素,又叫字符,字符分为普通字符和转义字符
str1 = '123'
str2 = "abc"
str3 = '''
123abc
'''
str4 = """
数据上报
"""
str5 = '😊'
str6 = """
莫愁前路无知己,
天下谁人不识君。
"""
转义字符
str1 = '\tabc\n123\u4e00'
print(str1)
字符串有序
print('abc' == 'bac') # False
四、字符和字符编码
1.字符 - 字符串的每个元素
字符分为普通字符和转义字符
转义字符 - 在特定的一些符号前加\来表示特殊功能或者特殊意义的符号
常用的转义字符
\n - 换行(相当于按回车)
\t - 水平制表符(相当于按tab键)
\' - 一个普通的单引号
\" - 一个普通的双引号
\\ - 一个普通的反斜杠
# It's OK
str1 = "It's OK"
print(str1) # It's OK
str1 = 'It\'s OK'
print(str1) # It's OK
# I say: "good good study, day day up!"
str2 = "I say: \"good good study, day day up!\""
print(str2)
# C:\用户\test\name\yuting\aaa.txt
path = 'C:\用户\\test\\name\yuting\\aaa.txt'
print(path)
2.R语法
如果在字符串的最前面加r或者R可以让字符串中所有的转义字符功能消失,每个符号都会变成普通字符
五、字符编码
1.计算机存储数据的原理
计算机只具备存储数字的能力
2.字符编码
为了能够让计算机存储文字信息,给每一个符号对应了一个固定的数字,每次需要存储文字符号的时候就存储这个符号对应的数字。这个数字就是符号编码值
3.编码表
1)ASCII码表
有128个符号(美国符号),数字在大写字母前,大写字母在小写字母前面,大写字母和小写字母之间有缝隙
2)Unicode编码表(python)
Unicode编码表中包含了ASCII码表,Unicode包含了世界上所有的国家所有的名族的所有符号,又叫万国码
中文范围:4e00 ~ 9fa5
print(ord('朱'), ord('武'), ord('兵')) # 26417 27494 20853 4.Python对编码值的使用 # 1)chr函数 # chr(编码值) - 获取编码值对应的字符 print(chr(97)) # 'a' print(chr(1000)) # 'Ϩ' print(chr(0x9e00)) # '鸀' # 打印所有中文 # num = 0 # for x in range(0x4e00, 0x9fa5+1): # print(chr(x), end=' ') # num += 1 # if num % 30 == 0: # print() # print(num) # for x in range(0x1800, 0x18AF+1): # print(chr(x), end=' ') # 2)ord函数 # ord(字符) - 获取字符对应的编码值 print(ord('余'), ord('婷')) # 3)编码字符 # \u4的16进制数 - 创建一个字符,字符就是4的16进制数作为编码值对应的字符 str1 = '\u0061\u4f59\u5a77' print(str1) x = '好' print('\u4e00' <= x <= '\u9fa5')
六、字符串操作
字符串不可变,所以只支持查操作
1.查 - 获取字符
字符串获取字符和列表获取元素对应的语法一模一样
str1 = 'abc123'
print(str1[2], str1[-4]) # c c
print(str1[1:]) # bc123
print(str1[1:-1:2]) # b1
print(str1[3:1:2]) # ''
for i in str1:
print('i:', i)
# 每一个有效转义字符的长度都是1
str2 = '\ta\u4e00bc\n123\\'
print(str2[2]) # 一
print(str2[9]) # \
2.in和not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1
(判断字符串1是否是字符串2的子串)
print('ab' in 'abc') # True
print('a' in 'abc') # True
print('ac' in 'abc') # False
七、进制(了解)
# 数字常见的表示方式有4种:二进制、八进制、十进制、十六进制
# 1. 十进制
"""
基数:0,1,2,3,4,5,6,7,8,9
表示方式:直接写
转换方法:print(其他进制的数)
123 = 100 + 20 + 3 = 1*10^2 + 2*10^1 + 3*10^0
"""
print(10, 123)
print(0o12) # 10
print(0x4e00) # 19968
# 2. 二进制
"""
基数:0、1
表示方式: 加前缀0b、0B
转换方法:bin(其他进制的数)
"""
# 1100 -> 1*2^3 + 1*2^2 + 0*2^1 + 0*2^0 = 8 + 4 + 0 + 0 = 12
print(0b1100) # 12
print(12 + 1) # 13
print(0b1100 + 1) # 13
print(bin(12)) # 0b1100
print(bin(42)) # 0b101010
# print(0b112) # 报错
# 3.八进制
"""
基数:0、1、2、3、4、5、6、7
表示方式:加前缀0o、0O
转换方式:oct(其他进制的数据)
"""
# 0o56 - 5*8^1 + 6*8^0 = 40 + 6 = 46
print(0o56) # 46
# 4.十六进制
"""
基数:0、1、2、3、4、5、6、7、8、9、a/A、b/B、c/C、d/D、e/E、f/F
表示方式:加前缀0x、0X
转换方式:hex(其他进制的数)
"""
# 0xabc - a*16^2 + b*16^1 + c*16^0 = 10 * 256 + 11*16 + 12 = 2748
print(0xabc) # 2748
# 28291 是哪个字符的编码
print(chr(28291))
print('\u6e83')