day9集合、字符串总结和作业

tw886

于 2022-02-24 22:25:38 发布

阅读量380

点赞数

文章标签： python list

本文链接：https://blog.csdn.net/tw19980305/article/details/123122504

版权

day9集合、字符串总结和作业

一、集合

认识集合（set）

集合是容器型数据类型，将{}作为容器的标志里面多个数据用逗号隔开：{数据1，数据2 ，…}

可变的（支持增删改）；无无序（不支持下标操作）

元素的要求：

必须是不可变的数据
元素是唯一的

#空集合
set1 = set()

#集合是无序的
print({1,2,3} == {3,2,1})    #True

#集合元素必须是不可变类型的数据
set2 = {1,'abc',True,[10,20]}  
print(set2)   #报错

#集合元素是惟一的
set3 = {10,20,10,20,30,10}
print(set3)   #{10, 20, 30}

集合的增删改查

1）查 - 只能遍历无序列表的时候

补充：用for循环遍历---------

set1 = {'进击的巨人','海贼王','一拳超人','一人之下','死亡笔记'}
for x in set1:
    print(x)

2）增

集合.add(元素) - 添加指定元素

set1 = {'进击的巨人','海贼王','一拳超人','一人之下','死亡笔记'}
set1.add('全职法师')
print(set1)  #{'一人之下', '进击的巨人', '全职法师', '死亡笔记', '海贼王', '一拳超人'}

集合.update(序列) - 将序列中所有元素都添加到集合中

set1 = {'进击的巨人','海贼王','一拳超人','一人之下','死亡笔记'}
set1.update(['全职法师','斗罗大陆','斗破苍穹'])
print(set1)  #{'全职法师', '斗罗大陆', '一拳超人', '一人之下', '进击的巨人', '死亡笔记', '斗破苍穹', '海贼王'}

3）删

集合.remove(元素)

set1 = {'进击的巨人','海贼王','一拳超人','一人之下','死亡笔记'}
set1.remove('一人之下')
print(set1)   #{'死亡笔记', '海贼王', '一拳超人', '进击的巨人'}

数字集合运算

python中使用的集合和数学集合是一个东西，并且支持数学集合运算

python支持的数学集合运算：交集(&)、并集(|)、差集(-)、对称差集(^)、子集(>=、<=)、真子集(>、<)

1）交集 - 获取两个集合的公共部分

set1 = {1,2,3,4,5}
set2 = {3,4,5,6,7,8}
print(set1 & set2)  #{3, 4, 5}

2）并集 - 将两个集合合并成一个集合

set1 = {1,2,3,4,5}
set2 = {3,4,5,6,7,8}
print(set1 | set2)   #{1, 2, 3, 4, 5, 6, 7, 8}

3）差集 - 获取集合1中去掉包含在集合2 中的部分剩下的部分

set1 = {1,2,3,4,5}
set2 = {3,4,5,6,7,8}
print(set1 - set2)  #{1, 2}
print(set2 - set1)  #{8, 6, 7}

4）对称差集 - 将两个集合合并然后去掉公共部分

set1 = {1,2,3,4,5}
set2 = {3,4,5,6,7,8}
print(set1 ^ set2)   #{1, 2, 6, 7, 8}

5）子集和真子集

集合1 > 集合2 - 判断集合2是否是集合1的真子集
集合2 > 集合1 - 判断集合1是否是集合2的真子集

print({1,2} < {1,2,3})  #True

二、字符串和字符

字符串（str）

字符串是容器型数据类型，将’ ’ 、" “、’’’ ‘’’、”"" “”"作为容器的标志，引号里面的一个符号都是字符串的元素（字符串的元素又叫字符）

不可变的（不支持增删改）、有序的（支持下标操作）

字符串的元素：一切符号都可以作为字符串的元素

#空串
str = ''
print(set)

字符 - 字符串中的每个独立的符号就是一个字符

1）普通字符 - 表示符号本身的字符就是普通字符

2）转义字符 - 具备相当于特殊功能或者特殊意义的符号就是转义字符。所有的转义字符的通用格式：\x

转义字符是通过 \加普通字符构成的，但是不是所有的普通字符前面加\就能构成转义字符

注意：所有转义字符的长度都是1

\n - 换行

\t - 水平制表符（相当于按一次tab键）

\ ’ - 一个单引号

\ " - 一个双引号

\ \ - 一个反斜杠

\u4位的十六进制数 - 编码字符

十六进制数 - 每一位上的数可以是0-9或者a-f(A-F)

str1 = '\tabc\n123\u4e00'
print(len(str1))    #  9

三、字符编码

计算机存储数据的原理

计算机能够直接存储的数据只有数字，存数字的时候保存的是数字的补码

如果想要将非数字数据保存到计算机中，存储的时候一定会先将数据转换成数字

如果需要存储的是文字，计算机会保存这个文字符号对应的编码值

编码值

每个文字符号（字符）在计算机都对应一个固定的数字，这个数字就是这个符号的编码值

字符编码表 - 记录每个符号和数字对应关系的表

常用编码表：ASCII编码表、Unicode编码表（python）

1）ASCII编码表

只有128个字符
数字字符在字母的前面、大写字母在小写的前面、大写字母和小写字母之间有间隙
数字从0开始连续递增，字母从（a/A)开始连续递增

2）Unicode编码表 - 是ASCII编码表的扩展，里面包含ASCII编码表

Unicode编码表中包含了世界上所有的国家所有的民族的所有符号

中文编码范围：4e00 ~ 9fa5

编码值在python中的应用

1）chr函数：chr(编码值) - 获取编码值对应的字符；编码值 - 整数

print(chr(97), chr(65))    #a  A

2）oed函数：oed(字符) - 获取字符对应的编码值；字符 - 长度是1的字符串

print(ord('田'), ord('a'))   #24336  97

3）编码字符

四、字符串常用操作

查 - 获取字符

字符串获取字符和列表获取元素的语法一模一样

str1 = 'hello world!'
print(str1[-3:])        # 'ld!'
print(str1[-5::-1])     # 'ow olleh'

字符串相关操作

1）+ 、 *

str1 = 'abc'
str2 = '123'
print(str1 + str2)      # 'abc123'
print(str1 * 3)     # 'abcabcabc'

2）比较大小：>、<、>=、<=

两个字符串比较大小，比较的是第一对不相等的字符的编码值的大小；

print('abc' > 'Zn')  #True

应用：判断字符的性质

判断字符x是否是数字字符：‘0’ <= x <= ‘9’
判断字符x是否是小写字母：‘a’ <= x <= ‘z’
判断字符x是否是大写字母：‘A’ <= x <= ‘Z’
判断字符x是否是字母：‘a’ <= x <= ‘z’ or A’ <= x <= ‘Z’
判断字符x是否是中文：’\u4e00’ <= x <= ‘\u9fa5’

ch = '是'
print('\u4e00' <= ch <= '\u9fa5')    #True

3）in 和 not in

字符串1 in 字符串2 - 判断字符串1是否在字符串2中（判断字符串1是否是字符串2的字串）

str1 = 'abc123'
print('a' in str1)      # True
print('abc' in str1)    # True
print('23' in str1)     # True
print('13' in str1)     # False

作业

输入一个字符串，打印所有奇数位上的字符(下标是1，3，5，7…位上的字符)

例如: 输入’abcd1234 ’ 输出’bd24’

str1 = 'abcd1234'
print(str1[1::2])

输入用户名，判断用户名是否合法(用户名长度6~10位)

str1 = input('请输入用户名：')
if 6 <= len(str1) <= 10:
    print('合法')
else:
    print('不合法')

输入用户名，判断用户名是否合法(用户名中只能由数字和字母组成)

例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法

str1 = input('请输入用户名：')
count = 0
for x in str1:
    if '0' <= x <='9' or 'A' <= x <='Z' or 'a' <= x <='z':
        count += 1
if count == len(str1):
    print('合法')
else:
    print('不合法')

输入用户名，判断用户名是否合法(用户名必须包含且只能包含数字和字母，并且第一个字符必须是大写字母)

例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法

str1 = input('请输入用户名：')
count = 0
for x in str1:
    if '0' <= x <='9' or 'A' <= x <='Z' or 'a' <= x <='z':
        count += 1
if count == len(str1) and 'A' <= str1[0] <='Z' :
    print('合法')
else:
    print('不合法')

输入一个字符串，将字符串中所有的数字字符取出来产生一个新的字符串

例如：输入**‘abc1shj23kls99+2kkk’** 输出：'123992’

str1 = 'abc1shj23kls99+2kkk'
str2 = ''
for x in str1:
    if '0' <= x <= '9':
        str2 += x
print(str2)

输入一个字符串，将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)

例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'

#方法一：
str1 = 'a2h2klm12+'
print(str1.upper())

#方法二：
str1 = 'a2h2klm12+'
str2 = ''
for x in str1:
    if 'a' <= x <= 'z':
        x = chr(ord(x) -32)
    else:
        x = x
    str2 += x
print(str2)

输入一个小于1000的数字，产生对应的学号

例如: 输入**‘23’，输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’，输出’py1901123’**

n = input('请输入一个整数：')
if len(n) == 1:
    print('py190100' + n)
elif len(n) == 2:
    print('py19010' + n)
else:
    print('py1901' + n)

输入一个字符串，统计字符串中非数字字母的字符的个数

例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3

str1 = input('请输入一个字符串：')
count = 0
for x in str1:
    if 'a' <= x <= 'z' or '0' <= x <= '9':
        count += 1
print(len(str1) - count)

9.输入字符串，将字符串的开头和结尾变成’+’，产生一个新的字符串

例如: 输入字符串**‘abc123’, 输出’+bc12+’**

str1 = 'abc123'
str2 = str1[1:-1]
print('+' + str2 + '+')

输入字符串，获取字符串的中间字符

例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**

str1 = input('请输入一个字符串：')
if len(str1) % 2 == 1:
    print(str1[len(str1) // 2])
else:
    print(str1[len(str1)// 2 - 1],str1[len(str1)//2])

写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8

str1 = 'how are you? Im fine, Thank you!'
str2 = 'you'
count = -1
for i in str1:
    count += 1
    if i == str2[0]:
        print(count)
        break

获取两个字符串中公共的字符

例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

str1 = 'abc123'
str2 = 'huak3'
str3 = ''
for i in str1:
    for j in str2:
        if i == j:
            str3 += i
print(str3)

tw886

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
day9集合、字符串总结和作业

day9集合、字符串总结和作业一、集合认识集合（set）集合是容器型数据类型，将{}作为容器的标志里面多个数据用逗号隔开：{数据1，数据2 ，…}可变的（支持增删改）；无无序（不支持下标操作）元素的要求：必须是不可变的数据元素是唯一的#空集合set1 = set()#集合是无序的print({1,2,3} == {3,2,1}) #True#集合元素必须是不可变类型的数据set2 = {1,'abc',True,[10,20]} print(set2)
复制链接

扫一扫