元组集合和字符串

1. 元组和集合

1.1 元组

1.1.1 什么是元组(tuple)

1)容器;将()作为容器的标志,里面多个元素用逗号隔开:(元素1,元素2,元素3,…);

2)不可变的(不支持增删改);有序的(支持下标操作);

3)元素:任何数据。

# 空元组
t1 = ()

# 只有一个元素的元组(重点)  -  唯一的这个元素后必须加逗号
t2 = (100)
print(t2,type(t2))    # 100 <class 'int'>

t3= (100,)
print(t3,type(t3),len(t3))    # (100,) <class 'tuple'> 1

# 在没有歧义的情况下,元组的()可以省略  -  直接将多个数据用逗号隔开,表示的也是一个元组
t4 = 10,20,30
print(t4)     # # (10, 20, 30)
1.1.2 元组就是不可变的列表

列表中除了和可变相关的操作,其他操作元组都支持。

t1 = 10,20,30,10
print(t1[1])          # 20
print(t1.count(10))   # 2

for x in t1:
    print(x)

print(15 in t1)    # False
print(10 pyin t1)    # True

1.2 集合

1.2.1 什么是集合(set)

1)容器;将{}作为容器的标志,里面多个元素用逗号隔开:{元素1,元素2,元素3,…};

2)可变的;无序的;

3)元素的要求:和字典对键的要求一样(不可变的数据;唯一的)。

# 空集合
s1 = set()
print(type(s1),len(s1))    # <class 'set'> 0

# 集合无序
print({1,2,3} == {3,2,1})    # True

# 元素是不可变类型的数据
s2 = {10,'abc',(1,2)}
print(s2)    # {'abc', 10, (1, 2)}

# s3 = {10,'abc',[1,2]}
# print(s3)    # TypeError: unhashable type: 'list'

# 元素是唯一的  -  去重
s3 = {10,20,30,10,30,20}
print(s3)    # {10, 20, 30}
1.2.2 数学集合运算

&(交集)、|(并集)、-(差集)、^(对称差集)、>、<(判断是否是真子集)、<=、>=(判断是否是子集)。

集合运算

s1 = {1,2,3,4,5,6,7}
s2 = {5,6,7,8,9,10}

# &(交集)  -  集合1 & 集合2  -  获取两个集合的公共部分
print(s1 & s2)   # {5, 6, 7}

# 集合1 | 集合2  -  合并两个集合
print(s1 | s2)   # {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

# 集合1 - 集合2
print(s1 - s2)   # {1, 2, 3, 4}
print(s2 - s1)   # {8, 9, 10}

# 集合1 ^ 集合2
print(s2 ^ s1)   # {1, 2, 3, 4, 8, 9, 10}

# >、<  -  判断是否是真子集
# 集合1 > 集合2   -  集合2是否是集合1的真子集

# >=、<=  -  判断是否是子集

'''
{1,2,3}
子集:{}、{1}、{2}、{3}、{1,2}、{1,3}、{2,3}、{1,2,3}
真子集:{}、{1}、{2}、{3}、{1,2}、{1,3}、{2,3}
'''

3. 认识字符串

3.1 什么的字符串(str)

1)字符串是容器型数据类型;将’‘、“”、’‘’‘’'、“”“”""作为容器的标志,引号中的每个符号就是字符串的元素;

2)字符串是不可变的;字符串有序(支持下标操作);

3)元素:引号中的每个符号就是字符串的元素,字符串的元素又叫字符。字符又分为普通字符和转义字符两种。

# 1)引号中的每个符号都是字符串的元素,对于符号本身没有限制
str1 = 'abc23胡椒粉和😀❀♥'
new_str1 = str1.upper()
print(new_str1)    # ABC23胡椒粉和😀❀♥

# 2)引号问题
str2 = 'abc'
str3 = 'mn123'
str4 = '''abc'''
str5 = """abc"""
print(type(str1),type(str2),type(str3),type(str4),type(str5))    # <class 'str'> <class 'str'> <class 'str'> <class 'str'> <class 'str'>

# 3)多行字符串  -  三个引号开头的字符串,字符串内容可以直接按回车换行
str1 = '''abc
123'''
print(str1)
'''
abc
123
'''

str1 = 'abc' \
       '123'
print(str1)   # abc123

str1 = 'abc\n123'
print(str1)
'''
abc
123
'''

# 4)空串  -  引号内什么都没有,空格也不行
str1 = ''
print(len(str1),type(str1))    # 0 <class 'str'>

str1 = ' '
print(len(str1),type(str1))    # 1 <class 'str'>

4. 字符和转义字符

4.1 字符

字符:字符串的元素。

4.1.1 普通字符

在字符串中表示符号本身的字符就是普通字符,例如:中文、字母、数字等

4.1.2 转义字符

在特定的符号前加\来表示特殊功能或者特殊意义的符号就是转义字符。

'''
\t  -  水平制表符(相当于按一次tab键)
\n  -  换行
\'  -  表示一个普通的单引号
\"  -  表示一个普通的双引号
\\  -  表示一个普通的反斜杠
'''
''
print('\tabc')   #  abc
print('abc\n123')
'''
abc
123
'''

print('it\'s me')    # it's me
print("it's me")     # it's me

print("I say:\"you see see,one day day\"")    # I say:"you see see,one day day"
print('I say:"you see see,one day day"')      # I say:"you see see,one day day"

print('\\abc123')    # \abc123

4.2 R语法

字符串的最前面可以加r或者R,让字符串中所有的转义字符功能消失,所有的字符都变成普通字符:r’‘、R’'。

str1 = '\tabc\n123\u4e00'
print(str1)
'''
   abc
123一
'''

str1 = r'\tabc\n123\u4e00'
print(str1)    # \tabc\n123\u4e00

5. 字符编码

5.1 字符编码

5.1.1 计算机储存原理

计算机保存数据的时候只能存数字,而且存的是数字的补码。

5.1.2 字符编码

为了能够让计算机保存文字符号,我们给每一个符号对应了一个固定数字,在存储符号的时候就保存这个符号对应的数字,那么这个数字就是这个符号的编码值。

5.2 编码表

编码表:保存符号和编码值对应关系的表。

5.2.1 ASCII码表

通过个字节来对128个字符进行编码,里面的字符是美国通用的符号。

数字在大写字母的前面,大写字母在小写字母前面,大写字母和小写字母之间有间隙(A - 65;a - 97)。

5.2.2 Unicode编码表

包含了世界上所有的国家所有的民族所有的语言的符号(万国码)。

1)Unicode编码表是ASCII码表的扩展,它包含ASCII码表;

2)中文编码值范围(十六进制):4e00 ~ 9fa5 。

5.3 python使用编码值

5.3.1 chr函数

chr(编码值) :获取编码值对应的字符。

print(chr(97))    # a
print(chr(65))    # A
# 注意:如果想要在程序中直接使用16进制数,数字前必须加前缀'0x'、'0X'
print(chr(0x4e00))   # 一

# 打印所有中文
count = 0
for x in range(0x4e00,0x9fa5+1):
    count += 1
    print(chr(x),end=' ')
    if count % 40 == 0:
        print()

# 打印盲文
count = 0
for x in range(0x2800,0x28FF+1):
    count += 1
    print(chr(x),end=' ')
    if count % 40 == 0:
        print()
5.3.2 ord函数

ord(字符):获取指定字符对应的编码值。

print(ord('余'),ord('婷'))   # 20313 23159
print(ord('钱'))            # 38065

# hex(十进制数)  -  获取指定十进制对应的16进制
print(hex(20313),hex(23159))  # 0x4f59 0x5a77
5.3.3 编码字符

在字符串中用’\u4位的16进制数‘来表示一个字符。

str1 = 'a\u0061一\u4e00'
print(str1)    # aa一一

x = '看'
# print('一' <= x <= '龥')          # True
print('\u4e00' <= x <= '\u9fa5')   # True

6. 获取字符

6.1 查

获取元素(字符)。

列表获取元素的方法字符串都支持。

str1 = '\thello world!'

# 注意:一个转义字符长度是1,一个空格的长度也是1
print(str1[2])    # 'e'
print(str1[-1])   # '!'

print(str1[1:4])  # 'hel'

str2 = 'hfhbjfb'
print(str2[1:-1])   # 'fhbjf'
print(str2[1:])     # 'fhbjfb'

str3 = 'abc123'
for x in str3:
    print(x)

for index in range(len(str3)):
    print(index,str3[index])

for index,item in enumerate(str3):
     print(index,item)

6.2 相关操作

6.2.1 +、*

1)字符串1 + 字符串2 - 将两个字符串合并成一个字符串。

str1 = 'hello'
str2 = 'python'
str3 = str1 + str2
print(str3)     # 'hellopython'

2)字符串 * N、N * 字符串 - 将N个字符串合并成一个字符串。

print(str1 * 3)    # 'hellohellohello'
6.2.2 比较大小

比较大小:>、>=、<、<=。

1)两个字符串比较大小比较的是第一对不相等的字符的编码值的大小;

2)两个字符比较大小就是比较两个字符的编码值的大小。

'''
x是否是数字:'0' <= x <= '9'
x是否是小写字母:'a' <= x <= 'z'
x是否是字母:'a' <= x <= 'z' or 'A' <= x <= 'Z'
x是否是中文:'\u4e00' <= x <= '\u9fa5'
'''
print('abc' < '1234567890')    # False
6.2.3 练习

练习1:已知一个字符串,统计字符串中数字字符的个数。

str1 = 'abc1123你好110'     # 7
count = 0
for x in str1:
    if '0' <= x <= '9':
        count += 1
print(count)

练习2:已知一个字符串,提取字符串中所有的中文字符。

str1 = 'ab啊c1123你好110是-2=2'    # '啊你好是'
new_str1 = ''
for x in str1:
    if '\u4e00' <= x <= '\u9fa5':
        new_str1 += x

print(str(new_str1))

6.3 in 和 not in

字符串1 in 字符串2:判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)。

# 'abc'的子串:''、'a'、'b'、'ab'、'bc'、'abc'
print('a' in 'abc')    # True
print('ab' in 'abc')   # True
print('ac' in 'abc')   # False

7. 作业

  1. 输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)

    例如: 输入’abcd1234 ’ 输出’bd24’

    str1 = 'abcd1234 '
    new_str1 = ''
    for index,item in enumerate(str1):
        if index % 2:
            new_str1 += item
    print(new_str1)
    
  2. 输入用户名,判断用户名是否合法(用户名长度6~10位)

    user_name = input('请输入用户名:')
    if 6<= len(user_name) <= 10:
        print('用户名合法')
    else:
        print('用户名不合法')
    
  3. 输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)

    例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法

    user_name = input('请输入用户名:')
    for x in user_name:
        if not ('0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z'):
            print('用户名不合法')
            break
    else:
        print('用户名合法')
    
  4. 输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)

    例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法

    user_name = input('请输入用户名:')
    for x in user_name:
        if not ('A' <= user_name[0] <= 'Z'):
            print('用户名不合法')
            break
        elif not ('0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z'):
            print('用户名不合法')
            break
    else:
        print('用户名合法')
    
  5. 输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串

    例如:输入**‘abc1shj23kls99+2kkk’** 输出:‘123992’

    str1 = 'abc1shj23kls99+2kkk'
    new_str1 = ''
    for x in str1:
        if '0' <= x <= '9':
            new_str1 += x
    print(new_str1)
    
  6. 输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)

    例如: 输入**‘a2h2klm12+’ ** 输出 ‘A2H2KLM12+’

    # 方法1:
    str1 = 'a2h2klm12+'
    print(str1.upper())
    
    # 方法2:
    str1 = 'a2h2klm12+'
    new_str1 = ''
    for x in str1:
        if 'a' <= x <= 'z':
            new_str1 += chr(ord(x) - 32)
        else:
            new_str1 += x
    print(new_str1)
    
  7. 输入一个小于1000的数字,产生对应的学号

    例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**

    num = input('请输入一个小于1000的数字:')
    print('py1901' + num.zfill(3))
    
  8. 输入一个字符串,统计字符串中非数字字母的字符的个数

    例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**‘===’** 输出:3

    str1 = 'anc2+93-sj胡说'
    count = 0
    for x in str1:
        if not('0' <= x <= '9' or 'A' <= x <= 'Z' or 'a' <= x <= 'z'):
            count += 1
    print(count)
    
  9. 输入字符串,将字符串的开头和结尾变成’+',产生一个新的字符串

    例如: 输入字符串**‘abc123’, 输出’+bc12+'**

    str1 = 'abc123'
    print(str1.center(len(str1)+2,'+'))
    
  10. 输入字符串,获取字符串的中间字符

    例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**

    str1 = 'abc1234'
    x = len(str1)
    if x % 2:
        print(str1[x//2])
    else:
        print(str1[x//2-1],str1[x//2])
    
  11. 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

    例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8

    str1 = 'how are you? Im fine, Thank you!'
    str2 = 'you'
    for x in range(0,len(str1)):
        if str1[x] == str2[0]:
            if str1[x:x + len(str2)] == str2:
                print(x)
                break
    
  12. 获取两个字符串中公共的字符

    例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

    str1 = 'abc123'
    str2 = 'huak3'
    str3 = ''
    for x in str1:
        if x in str2:
            str3 += x
    print(str3)
    

you, 打印8

```python
str1 = 'how are you? Im fine, Thank you!'
str2 = 'you'
for x in range(0,len(str1)):
    if str1[x] == str2[0]:
        if str1[x:x + len(str2)] == str2:
            print(x)
            break
```
  1. 获取两个字符串中公共的字符

    例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

    str1 = 'abc123'
    str2 = 'huak3'
    str3 = ''
    for x in str1:
        if x in str2:
            str3 += x
    print(str3)
    

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值