python集合和字符串

python集合和字符串

集合

1.认识集合(set)

1)定义:集合是容器型数据类型,将{}作为容器的标志,里面多个数据用逗号隔开:{数据1,数据2,…}。

2)特点:可变的,支持增删改的操作;

无序的,不支持需要下标的操作。

3)集合对元素的要求:必须是不可变的数据;元素是唯一的。

(空集合 set())

2.集合的增删改查

1)查 - 只能遍历

用for循环遍历无序序列的时候,系统在遍历前先将无序序列转换成列表,然后再遍历列表。

2)增

语法1:

集合.add(元素)

作用:添加指定元素。

语法2:

集合.upate(序列)

作用:将序列中所有的元素添加到集合中

3)删

语法:

集合.remove(元素)

作用:将集合中一个指定元素移除

3.python中集合和数学集合关系

python中使用的集合和数学集合是一个东西,并且python支持大部分数学集合运算;

python支持的数字集合运算有:交集(&)、并集(|)、差值(-)、对称差值(^)、字集(>=、<=)、真子集(>、<)。

1)交集 - 获取两个集合的公共部分;

2)并集 - 将两个集合合并成一个集合;

3)差集,集合1-集合2 – 获取集合1中去掉在集合2的部分剩下的值;

4)对称差值 - 将两个集合合并然后去掉两个集合公共部分;

5)子集和真子集

集合1>集合2 - 判断集合2是否是集合1的真子集;

集合1<集合2 - 判断集合1是否是集合2的真子集;

集合1>=集合2 - 判断集合2是否是集合1的子集;

集合1<=集合2 - 判断集合1是否是集合2的子集;

set1 = {'g', 'a', 's', 'f'}
set2 = {'g', 's' }
# 交集
print(set1 & set2)
# {'g', 's'}
# 并集
print(set1 | set2)
# {'g', 'a', 's', 'f'}
# 差集
print(set1 - set2)
# {'a', 'f'}
print(set2 - set1)
# set()
# 对称差值
print(set1 ^ set2)
# {'a', 'f'}
# 子集
print(set1 > set2)
# True
print(set1 < set2)
# False

字符串(str)(重要)

1.认识字符串

1)定义:字符串是容器型数据类型,将‘’,””,’’‘’‘’,”“”“”“(单引号,双引号,三个单引号,三个双引号)作为字符串的标志,引号里面的一个符号都是字符串的元素。

2)特点:不可变的,不支持增删改的操作;有序的,支持下标的操作。

3)字符串的元素要求:一切符号都可以作为字符串的元素,包括但不限于文字、数字、符号表情等等;字符串的元素又叫字符,分为普通字符和转义字符。

(空串 ’‘ - 中间不可以任何符号包括空格)

2.字符 - 字符串的每一个独立的符号就是一个字符。

字符分为:普通字符和转义字符;

1)普通字符 - 表示符号本身的字符,一般除了转义字符以外的字符都是普通字符;

2)转义字符 - 具备特殊功能或者特殊原因的符号就是转义字符,所有是转义字符的通用格式:\x、\\xxx;

转义字符是通过\加普通字符构成的,但不是所有的普通字符前加都可以变成转义字符;

一般用的有:\n - 换行;\t - 水平制表符,相等与按一次tab键;\’ - 一个单引号;\" - 一个双引号;\\ - 一个反斜杠;

\u4位的十六位进制数 - 编码字符

(十六进制数 - 每一位上的数可以是09或者af(A~F))

3.字符编码

1)计算机存储数据的原理

原理:计算机能够直接存储的数据只有数字;存储数字的时候保存的是数字的补码;存储非数字时候一定是先将数据转换成数字,比如存储文字计算机保存的就是这个文字符号对应的编码值。

2)编码值

定义:每个符号(字符)在计算机都对应一个固定的数字,这个数字就是这个符号的编码值

3)字符编码表

a. 定义:记录每个符号和数字对应关系的表,常用的编码表,ASCII码表、Umicode编码表。

b. ASCII码表

只有128个字符,现已不符合现实需求。

在ASCII码表中:数字从0开始连续递增;数字字符在字母前;字母从a/A开始连续递增,a/A的十进制编制值是97/65;写字母在小写字母前;大小写字母之间有间隙;字母从a/A;

c. Umicode编码表

Umicode编码表是ASCII码表的扩展,又见万国码,里面包含了ASCII码表,还包含了世界上大部分国家、民族的绝大部分的符号。

中文编码范围:4e00~9fa5

4)编码值在python中的应用

a. chr函数:chr(编码值) - 获取编码值对应的字符;编码值要求是整数。

b. ord函数:ord(字符) - 获取字符对应的编码值;字符要求长度是一的字符串。

c. 编码字符

程序中直接表示16进制数,加前缀 0x/0X

hex(数字) - 将数字转换成16进制;

应用:判断字符是否是中文字符

‘\u4e00’ <= ‘是’ <= ‘\u9fa5’

字符串常用操作

1.查 - 获取字符

字符串获取字符和列表获取元素的语法是一样。

2.字符串相关操作

1)+、*

2)比较:>、<、>=、<=

两个字符串比较,比较的是第一对不相等的字符的编码大小。

应用:判断字符的性质

a,判断字符x是否是数字字符:‘0’<= x <= ‘9’
b,判断字符x是否是小写字母:‘a’<= x <= ‘z’
e,判断字符x是否是中文:‘\u4e00’<= x <= ‘\u9fa5’

3)in和not in

字符串1 in 字符串2 - 判断字符串1是否字符串2中,判断字符串1是否是字符串2的子串。

练习题

  1. 输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)

    例如: 输入’abcd1234 ’ 输出’bd24’

    str1 = input('输入一个字符串')
    print(str1[1::2], '1')
    
  2. 输入用户名,判断用户名是否合法(用户名长度6~10位)

    str2 = input('输入用户名')
    if 6 <= len(str2) <= 10:
        print('合法', '2')
    else:
        print('不合法', '2')
    
  3. 输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)

    例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法

    str3 = input('输入用户名')
    for x in str3:
        if not('a' <= x <= 'z' or '0' <= x <= '9' or 'A' <= x <= 'Z'):
            print('不合法', '3')
            break
    else:
        print('合法', '3')
    
  4. 输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)

    例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法

    str4 = input('输入用户名')
    a = str4[0]
    if 'A' <= a <= 'Z':
        for x in str4[1:]:
            if not('a' <= x <= 'z' or '0' <= x <= '9'):
                print('不合法', '4')
                break
        else:
            print('合法', '4')
    else:
        print('不合法', '4')
    
  5. 输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串

    例如:输入**‘abc1shj23kls99+2kkk’** 输出:‘123992’

    str5 = input('输入一个字符串')
    a5 = ''
    for x in str5:
        if '0' <= x <= '9':
            a5 += x
    print(a5, '5')
    
  6. 输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法方式实现)

    例如: 输入**‘a2h2klm12+’ ** 输出 ‘A2H2KLM12+’

    str6 = input('输入一个字符串')
    print(str6.upper(), '6')
    
  7. 输入一个小于1000的数字,产生对应的学号

    例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**

    a7 = input('输入一个小于1000的数字')
    if len(a7) == 1:
        print('py190100'+a7)
    elif len(a7) == 2:
        print('py19010'+a7)
    elif len(a7) == 3:
        print('py1901'+a7)
    
  8. 输入一个字符串,统计字符串中非数字字母的字符的个数

    例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**‘===’** 输出:3

    str8 = input('输入一个字符串')
    a8 = 0
    for x in str8:
        if not ('a' <= x <= 'z' or '0' <= x <= '9' or 'A' <= x <= 'Z'):
            a8 += 1
    print(a8)
    
  9. 输入字符串,将字符串的开头和结尾变成’+',产生一个新的字符串

    例如: 输入字符串**‘abc123’, 输出’+bc12+'**

    str9 = input('输入一个字符串')
    print('+'+str9[1:-2]+'+')
    
  10. 输入字符串,获取字符串的中间字符

    例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**

str10 = input('输入一个字符串')
a9 = len(str10) // 2
if len(str10) % 2 == 0:
 print(str10[a9], str10[a9+1])
else:
 print(str10[a9])
  1. 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

    例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8

str11_1 = 'how are you? Im fine, Thank you!'
str11_2 = 'you'
print(str11_1.find(str11_2))
  1. 获取两个字符串中公共的字符

    例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

str12_1 = 'abc123'
str12_2 = 'huak3'
print(set(str12_1) & set(str12_2))

str11_1 = 'how are you? Im fine, Thank you!'
str11_2 = 'you'
print(str11_1.find(str11_2))
  1. 获取两个字符串中公共的字符

    例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

str12_1 = 'abc123'
str12_2 = 'huak3'
print(set(str12_1) & set(str12_2))

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值