d9 字符串

d9 字符串

一.字符串和字符

1.什么是字符串(str)

  • 它是容器型数据类型:将’‘或者""或者’’’’’'或者""""""作为容器标志,引号中每个符号就是字符串的元素。

  • ‘’/"“和’’’’’’/”"""""的区别:在表示字符串内容的时候换行可以不使用转义字符,而是直接按回车

  • 字符串元素是不可变的(不支持增删改);字符串是有序的(支持下标操作)

  • 元素:引号中每个符号都是字符串的元素(又叫字符),字符可以是任何符号。

    • 字符分为两类:普通字符(表示符号本身字符)、转义字符(符号的存在具有特殊的功能和意义)

2.字符串的元素 - 字符

  • 字符分为普通字符和转义字符两种
    • 转义字符 - 在特定符号前加反斜杠\ 让符号具备特殊的功能
    • 常用转义字符:\n - 换行 、\t - 水平制表符(相当于TAB键的功能)、\’ - 表示一个普通的单引号
      \" - 表示一个普通的双引号、 \\ - 表示一个普通的反斜杠
    • 一个转义字符的长度是1
print('it\'s me!')	#it's me!
print("it's me!")	#it's me!
# 空串
str1 = ''
print(str1, type(str1), len(str1))	# '' <class 'str'> 0

3.字符编码

  • 编码
    • 计算机只能直接存储数字(而且保存的数字的二进制的补码),文字符号是无法直接存储的。为了能够让计算机具备存储文字符号的能力,我们给所有的文字符号对应一个固定的数据,每次要存储符号的时候就把符号对应的数字存起来,
      符号对应的数字就是符号的编码值
  • 编码表
    • ASCII码表
      • 总共有128个字符(美国符号)
      • 数字在字母的前面;大写字母在小写字母前;大写字母和小写字母之间有其他符号
    • Unicode编码表(Python)
      • Unicode编码表是对ASCII表的扩展,包含了世界上所有的国际所有的民族所有的语言的符号(又称万国码),总共65536个
      • 中文范围:4e00 ~ 9fa5
    • 编码值在Pyhton中的使用
      • chr函数:chr(编码值) - 获取编码值对应的字符
      • ord函数:ord(字符) - 获取字符的编码值
      • 编码字符: \u4e00 (4e00就是1个16进制的编码值)
    • 注:python中需要字符的地方都必须使用长度为1的字符串赋值
print(chr(97), chr(0x23))	# a #
print(chr(0x4e00))		# 一	
print(chr(0x9fa5))		# 龥

print(ord('小'))		# 23567

# 练习:将大写字母转换成对应的小写字母
c = 'M'
new_c = chr(ord(c) + 32)
print(new_c)
二.字符串相关操作

1.查 - 获取字符的字符(字符串获取字符的语法和列表获取元素的语法一模一样)

str1 = '\tabc\n123\'+-'
for x in str1:
    print(x)

for index in range(len(str1)):
    print(index, str1[index])

for index, item in enumerate(str1):
    print(index, item)

2.数学运算

# 'ss试试看78,mvn0-k=上课23'  -> 'ssmvnk'
str2 = 'ss试试看78,mvn0-k=上课23'
new_str2 = ''
for x in str2:
    if 97 <= ord(x) <= 122:
        new_str2 += x
print(new_str2) #ssmvnk

3.比较运算符

  • 比较是否相等: ==、!=
print('abc' == 'abc')   #True
print('abc' == 'acb')   #False
  • 比较大小:>、<、>=、<= — 两个字符串比较大小,比较的是第一对不相等的字符的编码值的大小
    • char = ?
      判断是否是数字字符: ‘0’ <= char <= ‘9’
      判断是否是小写字母: ‘a’ <= char <= ‘z’
      判断是否是大写字母: ‘A’ <= char <= ‘Z’
      判断是否是中文: ‘\u4e00’ <= char <= ‘\u9fa5’
str3 = '你好loe--23=sks;M9JHkyu是-12山卡拉'
# 1)统计中文字符的个数
count = 0
for x in str3:
    if '\u4e00' <= x <= '\u9fa5':
        count += 1
print(count)
# 2)打印字符串中所有的数字字符
for x in str3:
    if '0' <= x <= '9':
        print(x)
# 3)提取字符串中所有的字母
new_str2= ''
for x in str3:
    if 'a' <= x <= 'z' or 'A' <= x <= 'Z':
        new_str2 += x
print(new_str2)

4.in 和 not in — 字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)

print('abc' in 'abc123')    #True
print('1' in 'abc123')   #True
print('ac' in 'abc123')  #False

5.r语法 (r-string) - 在字符串的前面加r/R — 如果在字符串前面加r,那么字符串中所有的转义字符的功能都会消失(r功能阻止转义)

str4 = r'abc\n213'
print(str4) #abc\n213

6.相关函数

  • len(字符串)

  • str(数据) - 将数据转换成字符串 (任何类型的数据都可以转换成字符串;转换的时候是在数据的打印值的外面加引号)

  • eval(字符串) - 去掉字符串最外边的引号,获取数据(如果去点引号后是表达式,就计算表达式的结果)

print(str(5 + 5)) #'10'
print(str(100))     #'100'
print(str([10, 20 ,30]))    #'[10, 20, 30]'
print(str([1,2,3])) #[1, 2, 3]

print(eval('100'))
print(eval('10 + 20'))
三.字符串相关操作

1.john — 字符串.john(序列) - 将序列中的元素用指定的字符串拼接成一个字符串(序列中的元素必须是字符串)

list1 = ['abc', 'name', '123', 'sfa']
s1 = '-'
s2 = ''
print (s1.join(list1))  #abc-name-123-sfa
print (s2.join(list1))  #abcname123sfa

# 练习:将list2中所有元素拼接成一个字符串
list2 = ['abc', 100, True, 'hello']
print(''.join([str(x) for x in list2]))

# 练习2:将list2中所有的字符串拼接成一个字符串
list2 = ['abc', 100, True, 'hello']     # abchello
print(''.join([x for x in list2 if type(x) == str]))

2.count — 字符串1.count(字符串2) - 统计字符串1中字符串2出现的次数

message = 'how are you? i am fine! thank you! and you?'
print(message.count('you')) # 3

3.index/find

  • 字符串1.index(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的)

  • 字符串1.find(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的)

  • rindex / rfind - 是从右往左找,找到的是最后一次出现的字符串2

  • 在字符串2不存的时候index会报错,find不会报错并且返回-1

print(message.index('you'))  # 8
print(message.find('you'))  # 8
print(message.rfind('you')) #39

4.split

  • 字符串1.split(字符串2) - 将字符串1中所有的字符串2作为切割点对字符串1进行切割

  • 字符串1.split(字符串2, N) - 最多切N次

message = 'mnabc123abcxyzabcoop'
print(message.split('abc')) #['mn', '123', 'xyz', 'oop']

5.replace

  • 字符串1.replace(字符串2,字符串3) - 将字符串1中所有的字符串2都替换成字符串3

  • 字符串1.replace(字符串2,字符串3, N) - 只替换前N个

message = 'mnabc123abcxyzabcoop'
print(message.replace('abc', 'sb')) #mnsb123sbxyzsboop
print(message.replace('abc', 'sb', 2))  #mnsb123sbxyzabcoop

6.center/rjust/ljust/zfill

  • 字符串1.center(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居中

  • 字符串1.rjust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居右

  • 字符串1.ljust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居左

  • 字符串1.zfill() == 字符串1.rjust(长度, ‘0’)

str1 = 'abc'
print(str1.center(9, '0'))  #000abc000

7.strip/rstrip/lstrip

  • strip - 同时去掉字符串两边的所有的空白

  • rstrip - 同时去掉字符串右边的所有的空白

  • lstrip - 同时去掉字符串左边的所有的空白

  • str2 = '\t     abc 123          \n'
    print(str2)
    print(str2.strip())	#abc 123
    

作业

  1. 输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)

    例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**

    nums = 'abcd1234'
    print(''.join([x for x in nums[1::2]]))
    
  2. 输入用户名,判断用户名是否合法(用户名长度6~10位)

    username = input('输入用户名:')
    if 6 <= len(username) <= 10:
        print('用户名合法')
    else:
        print('用户名不合法')
    
  3. 输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)

    例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法

    username = input('输入用户名:')
    for x in username:
        if 'a' <= x <= 'z' or '0' <= x <= '9' or 'A' <= x <= 'Z':
            continue
        else:
            print('用户名不合法')
            break
    else:
        print('用户名合法')
    
  4. 输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)

    例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法

    username = input('输入用户名:')
    if 'A' <= username[0] <= 'Z':
        for x in username[1:]:
             if 'a' <= x <= 'z' or '0' <= x <= '9' or 'A' <= x <= 'Z':
                 continue
             else:
                 print('用户名不合法')
                 break
        else:
            print('用户名合法')
    else:
        print('用户名不合法')
    
  5. 输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串

    例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’

    str1 = 'abc1shj23kls99+2kkk'
    print(''.join(x for x in str1 if '0' <= x <= '9'))
    
  6. 输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)

    例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'

    str1 = 'a2h2klm12+'
    print(str1.upper())
    
    str1 = 'a2h2klm12+'
    new_str1 = ''
    for x in str1:
        if 'a' <= x <= 'z':
            new_str1 += chr(ord(x) - 32)
        else:
            new_str1 += x
    print(new_str1)
    
    
  7. 输入一个小于1000的数字,产生对应的学号

    例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**

    stu_num = input('请输入一个小于1000的数字:')
    print('py1901' + stu_num.zfill(3))
    
  8. 输入一个字符串,统计字符串中非数字字母的字符的个数

    例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3

    str1 = input('输入字符串:')
    count = 0
    for x in str1:
        if not ('a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9'):
            count += 1
    print(count)
    
  9. 输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串

    例如: 输入字符串**‘abc123’, 输出’+bc12+’**

    str1 = input('输入字符串:')
    print(str1[1 : -1].center(len(str1), '+'))
    
  10. 输入字符串,获取字符串的中间字符

例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**

str1 = input('输入字符串:')
if len(str1) % 2 != 0:
    print(str1[len(str1) // 2])
else:
    print(str1[len(str1) // 2 - 1], str1[len(str1) // 2])
  1. 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8

str1 = 'how are you? Im fine, Thank you!'
print(str1.find('you'))
print(str1.index('you'))
  1. 获取两个字符串中公共的字符

例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

str1 = 'abc123'
str2 = 'huak3'
new_str = ''
for i in str1:
    if i in str2:
        new_str += i
print(new_str)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值