day8 字符串和相关方法与操作

1.什么是字符串(str)

字符串是容器型数据类型(序列),将’‘单引号或则""双引号或者’’’’’’,""""""三引号作为容器标志,
里面每一个独立的符号就是字符串的一个元素。
字符串是不可变的;字符串是有序的(支持下标操作)
字符串的元素:引号里面的每一个符号都是字符串的元素,字符串的元素又叫字符。
字符分为两种:普通字符、转义字符

1)空串

empty1 = ''
empty2 = ""
empty3 = ''''''
empty4 = """"""
print(empty1, type(empty1), len(empty1))    # <class 'str'> 0
print(empty2, type(empty2), len(empty2))    # <class 'str'> 0
print(empty3, type(empty3), len(empty3))    # <class 'str'> 0
print(empty4, type(empty4), len(empty4))    # <class 'str'> 0

1)字符串的容器标志,’‘和""没有区别,’’’’’'和""""""没有区别

‘‘和""里面的内容不能通过直接按回车换行,只能通过转义字符换行;’’'和"""里面的内容可以直接通过回车换行。

str1 = '  '
print(str1, type(str1), len(str1))  #   <class 'str'> 2

2.字符串的元素 - 字符

字符分为普通字符和转义字符两种
1)普通字符 - 在字符串中表示符号本身的字符
2)转义字符 - 使用\和其他符号一起来表示特殊功能和意义的字符
\n - 换行
\t - 水平制表符(相当于tab键)
\’ - 表示一个普通字符的单引号
\" - 表示一个普通字符的双引号
\\ - 表示一个普通字符的反斜杠
3)阻止转义 - 让字符串中所有的转义字符功能消失(让字符串中的每一个符号都表示符号本身)
在字符串前加r或者R:r’’ ; R’’
4) 转义字符 - 编码字符

\u4位的16进制数 - 16进制编码值对应的字符

print('\tabc\n123')
# print('i's me')     # 会报错
print('i\'s me')    # i's me
print("i's me")     # i's me
print('is "A"')     # is "A"
print('\u4E01')     # 丁

# print('F:\new\py作业')    # \n会换行
print('F:\\new\\py作业')   # F:\new\py作业
print(r'F:\new\py作业')   # F:\new\py作业

3.编码值 - 字符编码

1)编码值 - 计算机在存储符号的时候其实存的是符号对应的固定数字,这个数字就是符号对应的编码值

2)编码表 - 将字符和数字一一对应的表

ASCII码表:
1)总共有128个符号,只有美国常用符号,不包括中文
2)数字在字母的前面,大写字母在小写字母前面(A-Z=65-90,a-z=97-122),大写字母和小写字母中间有间隙

Unicode编码表(python):
1)Unicode编码表中包含ASCII码表,;
2)包含了目前世界所有国家所有民族的所有语言符号(万国码)
3)中文编码范围:4E00~9FA5
chr(编码值) - 获取编码值对应的字符
ord(字符) - 获取指定字符的编码值(凡是需要字符的地方,都给长度是1的字符串)
编码字符 - \u4e00 (如果\u后面不足4位数,则在前面补零,直到4位为止)

print(chr(97))  # 'a'
print(chr(0x4E01))  # '丁'
print(0x9fa6 - 0x4e00)	# 20902

print(ord('贺'), ord('庭'), ord('杰'))
print(bin(ord('杰')))    # 0b110011101110000  bin() -   将其他进制的数据转换成2进制的数据
print(oct(ord('杰')))    # 0o63560 			oct() -   将其他进制的数据转换成8进制的数据
print(hex(ord('杰')))    # 0x6770 			hex() -   将其他进制的数据转换成16进制的数据
print('a123')   # a123
print('\u0061123')  # a123

1.内存单位

位(bit) - 计算机内存最小单位

字节(byte) 1字节 = 8位(bit)- 程序申请内存的最小单位

kb 1kb = 1024字节

MB 1MB = 1024kb

G 1G=1024MB

T 1T=1024G

2.进制

计算机中数字常见进制有4种:2进制、8进制、10进制、16进制。

1)2进制

"""
基数:0;1
进位:逢2进1
位权:2**(N-1) 110 = (1*2**2) + (1*2**1) + (0*2**0)= (4) + (2) + (0) = 6 (加括号便于阅读)
表示方式:加前缀 0b/0B
“”"

#### 任何数的0次方都是1 ####

2)8进制

"""
基数:0;1;2;3;4;5;6;7
进位:逢8进1
位权:8**(N-1) 12 = (1*8**1) + (2*8**0) = (8) + (2) = 10
表示方式:0o/0O
“”"

3)10进制

"""
基数:0;1;2;3;4;5;6;7;8;9
进位:逢10进1
位权:10**(N-1),123 = (1*10**2) + (2*10**1) + (3*10**0) = 100+20+3 = 123
表示方式:直接写
“”"

4)16进制

"""
基数:0;1;2;3;4;5;6;7;8;9;a/A(10);b/B(11);c/C(12);d/D(13);e/E(14);f/F(15)
进位:逢16进1
位权:16**(N-1) 1f = (1*16**1) + (f*16**0)= (16) + (f) = (16) + (15) =31
表示方式:0x/0X
“”"

print(0b110)   # 6
print(0o12)     # 10
print(0x1f)     # 31

1.join

字符串.join(序列) - 将序列中的元素使用指定字符串连接产生一个新的字符串,序列中的元素必须是字符串

names = ['小明', '张三', '李四']
result = ''.join(names)
print(result)   # '小明张三李四'

result = ' '.join(names)
print(result)   # '小明 张三 李四'

result = '+'.join(names)
print(result)   # '小明+张三+李四'

message = 'abc'
print('.'.join(message))    # 'a.b.c'

num = [10, 9, 78, 67]
result = ''.join([str(i)for i in num])
print(result)   # '1097867'

list1 = ['name', 23, True, '你好', '哈哈']
# 'name+你好+哈哈'
result = '+'.join([i for i in list1 if type(i) == str])
print(result)   # 'name+你好+哈哈'

2.split

字符串1.split(字符串2) - 将字符串中所有的字符串2作为切割点对字符串1进行切割
切割完的字符串段数为字符串2的总数+1
字符串1.split(字符串2,N) - 将字符串1中1前N个字符串2作为切割点进行切割

str1 = 'how are you? i am fine, thank you! and you?'
result = str1.split(' ')
print(result)   # ['how', 'are', 'you?', 'i', 'am', 'fine,', 'thank', 'you!', 'and', 'you?']

result = str1.split('you')
print(result)   # ['how are ', '? i am fine, thank ', '! and ', '?']

print('abca123aamna'.split('a'))    # ['', 'bc', '123', '', 'mn', '']

str1 = 'abc12mn12xy12===12++'
print(str1.split('12', 2))  # ['abc', 'mn', 'xy12===12++']

3.replace

字符串1.replace(字符串2,字符串3) - 将字符串1中所有的字符串2都替换成字符串3
字符串1.replace(字符串2,字符串3,N) - 将字符串1中前N个字符串2都替换成字符串3

str1 = 'how are you? i am fine, thank you! and you?'
result = str1.replace('you', 'me')
print(result)   # 'how are me? i am fine, thank me! and me?'
print(str1.replace('you', 'me'))    # 同上↑
print(str1.replace('you', 'me', 2)) # how are me? i am fine, thank me! and you?

补充

字符串.zfill(长度) - 将字符串转换成指定长度的新字符,不够的在前面用0填充

print('9'.zfill(3))     # 009

字符串.center(长度,填充字符)
字符串.ljust(长度,填充字符)
字符串.rjust(长度,填充字符)

print('abc'.center(5, '+'))     # +abc+
print('abc'.ljust(5, '+'))  # abc++
print('abc'.rjust(5, '+'))  # ++abc
print('1'.rjust(3, '0'))    # 001
print('abc'.center(3, '+'))     # abc
print('abc'.center(4, '+'))     # abc+

字符串.isnumeric() - 判断字符串中是否只包含数字字符,字符0~9和符号本身意义是数值的字符都是True
字符串.isdigit() - 只有字符0~9是True
字符串.isdecimal() - 判断是否是10进制数字字符
字符串.islower() - 判断字符串中的字母是否是小写字母
字符串.isupper() - 判断字符串中的字母是否是大写字母

print('一百'.isnumeric())  # True
print('1'.isdigit())    # True
print('9'.isdecimal())  # True
print('a'.islower())  # True
print('A'.isupper())    # True

字符串相关操作

1.查

字符串获取字符和列表获取元素的语法一样

message = 'you see see one day day!'
print(message[2])   # u

一个空格是一个字符

str1 = 'abc 123'
print(str1[4])  # 1

一个转义字符是一个字符,长度是1

str2 = '\tabc\u4fa9 123'
print(str2[6])  # 1

message = 'you see see one day day!'
print(message[1:5])     # ou s
print(message[:-5:-1])  # !yad

for i in 'ab\u67afc':
    print(i, end='')    # ab枯c

2.运算符

字符串1 + 字符串2 - 将两个字符串拼接产生一个新字符串
字符串 * N - 将字符串重复N次产生一个新的字符串

print('abc' + '123')    # abc123
print('abc' == 'acb')   # False
print('a' == '\u0061')  # True

比较大小:> 、 < 、 >= 、 <=

两个字符串比较大小比较的是第一对不相等的字符的编码值的大小

"""
是否是数字字符:‘0’ <= char <=‘9’
是否是小写字母:‘a’<= char <=‘z’
是否是大写字母:‘A’<= char <=‘Z’
是否是字母:‘a’<= char <=‘z’ or ‘A’<= char <=‘Z’
判断是否是中文:’\u4e00’<= char <=’\u9fa5’
“”"

print('abc' > 'cd')     # False
print('abc' > 'Cd')     # True

练习:提取一个字符串中所有的数字字符

str1 = 'sh函数78sk--好2o'
str2 = ''
for i in str1:
    if '0' <= i <= '9':
        str2 += i
print(str2)     # 782

str3 = ''
for i in str1:
    if '\u4e00' <= i <= '\u9fa5':
        str3 += i
print(str3)     # 函数好

3.in 和 not in

字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)

print('abc' in 'a1b2c3')    # False
print('abc' in 'abc123')    # True

4.len、str

str(数据) - 将数据转换成字符串(任何类型的数据都可以转换成字符串,转换的时候在数据打印值外加引号)

print(str(100))     # '100'
print(str(12.5))    # '12.5'
list1 = [1, 2, 3]
print(str(list1))   # '[1, 2, 3]'
print(str(list1)[0])    # '['
dict1 = {'name': '小明', 'age': 18}
print(str(dict1))   # '{'name': '小明', 'age': 18}'
print(str(dict1)[0])    # '{'
dict2 = {"name": '小明', 'age': 18}
print(dict2)    # {'name': '小明', 'age': 18}

作业

  1. 输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)

    例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**

    str1 = input('请输入一个字符串:')
    print(str1[1::2])
    
  2. 输入用户名,判断用户名是否合法(用户名长度6~10位)

    username = input('请输入你的用户名:')
    if 5 < len(username) < 11:
        print('用户名合法,可以使用!')
    else:
        print('用户名不合法!')
    
  3. 输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)

    例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法

    username = input('请输入你的用户名:')
    for i in username:
        if '0' <= i <= '9':
            pass
        elif 'a' <= i <= 'z':
            pass
        elif 'A' <= i <= 'Z':
            pass
        else:
            print('用户名不合法')
            break
    else:
        print('用户名合法')
    # 优化写法
    for i in username:
    if not ('0' <= i <= '9' or 'a' <= i <= 'z' or 'A' <= i <= 'Z'):
    	print('用户名不合法')
        break
    else:
    	print('用户名合法')
    
  4. 输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)

    例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法

    nums = set([chr(i) for i in range(ord('0'), ord('9')+1)])
    alp = set([chr(i) for i in range(ord('a'), ord('z')+1)])
    Alp = set([chr(i) for i in range(ord('A'), ord('Z')+1)])
    
    username = input('请输入你的用户名:')
    set_name = set(username)
    nums_in_name = set_name - alp - Alp
    
    if username[0].isupper():
        if len(nums_in_name) != 0 and len(nums_in_name - nums) == 0:
            print('用户名合法')
        else:
            print('用户名不合法,必须包含数字和字母')
    else:
        print('用户名不合法,首字母必须是大写')
    
    # 方法2
    username = input('请输入你的用户名:')
     if 'A' <= username[0] <= 'Z':
     	count = 0
     	for i in username[1:]:
         	if not ('0' <= i <= '9' or 'a' <= i <= 'z' or 'A' <= i <= 'Z'):
             	print('不合法')
             	break
         	else:
             	if '0' <= i <= '9':
                 	count += 1
     	else:
         	if count == 0:
             	print('不合法')
         	else:
             	print('合法')
     else:
     print('不合法')
    
  5. 输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串

    例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’

    nums = input('请输入一个带数字的字符串:')
    new_nums = ''
    new_nums = ''.join([i for i in nums if '0' <= i <= '9'])
    print(new_nums)
    
  6. 输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)

    例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'

    str1 = input('请输入一个带小写字母的字符串:')
    print(str1.upper())
    
    # 方法2
     str1 = input('请输入一个带小写字母的字符串:')
     str2 = ''
     for i in str1:
         if 'a' <= i <= 'z':
             str2 += chr(ord(i)-32)
         else:
             str2 += i
     print(str2)
     
     #方法3
     str1 = input('请输入一个带小写字母的字符串:')
     print(''.join(chr(ord(i)-32) if i .islower() else i for i in str1))
    
  7. 输入一个小于1000的数字,产生对应的学号

    例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**

    stu_num = 'py1901'
    nums = input('请输入学生的学号(1000以内):')
    str0 = '0'
    if len(nums) > 3:
        print('输入一个1000以内的数')
    else:
        while len(nums) != 3:
            nums = str0 + nums
        print(stu_num+nums)
    
    nums = input('请输入学生的学号(1000以内):')
    stu_num = 'py1901'
    print(stu_num + '0'*(3-len(nums)) + nums)
    
  8. 输入一个字符串,统计字符串中非数字字母的字符的个数

    例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3

    count = 0
    str1 = input('请输入一个字符串:')
    for i in str1:
     if '0' <= i <= '9':
         continue
     elif 'a' <= i <= 'z':
         continue
     elif 'A' <= i <= 'Z':
         continue
     else:
         count += 1
    else:
     print(count)
     
     # 方法2
    count = 0
    for i in str1:
      if not (i.isdigit() or i.islower() or i.isupper()):
          count += 1
    print(count)
    
  9. 输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串

    例如: 输入字符串**‘abc123’, 输出’+bc12+’**

    # 方法1
    str1 = input('请输入一个字符串:')
    str2 = ''
    for i in range(len(str1)):
      if i == 0 or i == len(str1)-1:
          str2 += '+'
      else:
          str2 += str1[i]
    print(str2)
    
    # 最优写法
    print('+' + str1[1:-1] + '+')
    
  10. 输入字符串,获取字符串的中间字符

例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**

str1 = input('请输入一个字符串:')
result1 = len(str1)%2
result2 = len(str1) // 2
if result1 == 0:
 print(str1[result2-1]+str1[result2])
else:
 print(str1[result2])
  1. 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8

# 方法1
str1 = 'how are you? Im fine, Thank you!'
result = len(str1.split('you')[0])
if result == len(str1):
 print('没有该子串')
else:
 print(result)
# 方法2
length = len('you')
for i in range(len(str1)-2):
 if str1[i:i+length] == 'you':
     print(i)
     break
else:
 print('没有该子串')
  1. 获取两个字符串中公共的字符

例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

str1 = 'abc123'
str2 = 'huak3'
print(set(str1) & set(str2))	# {'3', 'a'}
print(''.join(set(str1) & set(str2)))	# 3a

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值