python - 字符串和字符

python - 字符串和字符

1.字符串(str)

1)什么是字符串

容器型数据类型;将’‘或者""或者’’’’’'或者""""""作为容器标志,引号中每个符号就是字符串的元素。
(’’’’’'和""""""在表示字符串内容的时候换行可以不使用转义字符,而是直接按回车)
字符串不可变(不支持增删改);字符串有序(支持下标操作)
元素:引号中的单独的每个符号都是字符串的元素(又叫字符),字符可以任何符号。
字符分为两类:普通字符(表示符号本身字符)、转义字符(符号的存在具有特殊的功能和意义)

str1 = '90,100'
str2 = "abc767=-=#%~时代峰峻"
str3 = 'abc\n123'
str4 = '''abc
          123'''
str5 = """abc
123
xy
"""
str6 = 'abc\n123'      # 'ABC123'
print(str6)

2)字符串的元素 - 字符

字符分为普通字符和转义字符两种
转义字符 - 在特定符号前加/让符号具备特殊的功能,常用转义字符如下:
\n - 换行
\t - 水平制表符(相当于tab键的功能)
’ - 表示一个普通的单引号
" - 表示一个普通的双引号
\ - 表示一个普通的反斜杠
一个转义符的长度是1
\u4位的字符编码值(4位的十六进制数) - 编码字符

str7 = '\tabc\n123'
print(str7)

str8 = 'it\'s me!'
print(str8)

str9 = "it's me!"
print(str9)

str10 = "I say:\"you see see, one day day!\""
print(str10)

str11 = 'I say:"you see see, one day day!"'
print(str11)

str12 = 'abc\\name\u4eff'
print(str12)   # abc\name仿

str13 = ''   # "",'''''',""""""
print(type(str13), len(str13))

2.字符编码

1)编码

计算机只能直接存储数字(而且保存的数字的二进制的补码),文字符号是无法直接存储到计算机中的。
为了能够让计算具备存储文字符号的能力,我们给所有的文字符号对应的一个固定的数字,每次要存储符号的时候就把符号对应的数字存起来。
符号对应的数字就是符号的编码值

2)编码表 - 保存符号和数字对应关系的表

① ASCII码表
a. 总共有128个字符(美国符号)
b. 数字在字母的前面;大写字母在小写字母前面;大写字母和小写字母之间有其他符号

② Unicode编码表(Python)
a. Unicode编码表是对ASCII表的扩展,包含了世界上所有的国家所有的民族所有语言的符号(又称万国码),总共:65536个
b. 中文范围:4e00 ~ 9fa5

③ 编码值在Python中的使用
a. chr函数: chr(编码值) - 获取编码值对应的字符
b. ord函数: ord(字符) - 获取字符的编码值
c. 编码字符: \u4e00 (4e00就是一个16进制的编码值)

注意:python中需要字符的地方都必须使用长度为1的字符串赋值

# 1) chr
print(chr(97))
print(chr(35), chr(0x23))
print(chr(0x4e00))   # 一
print(chr(0x9fa5))      # 龥

num = 0
for x in range(0x3040, 0x309f+1):
    print(chr(x), end=' ')
    num += 1
    if num % 30 == 0:
        print()

print()

# 2) ord
print(ord('子'), ord('明'))    # 23376 26126

# 练习:将大写字母转换成对应的小写字母
# A -> a,  M -> m
c = 'F'
new_c = chr(ord(c) + 32)
print(new_c)

str14 = 'abc\u5fdd-\u002b-\uA000'
print(str14)

3)查 - 获取字符串的字符

# 字符串获取字符的语法和列表获取元素的语法一模一样
str1 = '\tabc\n123\'+-'
print(str1[1])
print(str1[-1])
# print(str1[100])        # IndexError: string index out of range

print(str1[5:8], str1[5:-3])
print(str1[1:])
print(str1[::-1])

for x in str1:
    print(x)

for index in range(len(str1)):
    print(index, str1[index])

for index, item in enumerate(str1):
    print(index, item)

4)数学运算符:+、*

print('hello' + 'world!')   # helloworld!
print('hello' * 2)      # hellohello

name = '小明'
# 姓名: 小明
print('姓名: ' + name)

# 练习:提取字符中小写字母
# 'ss试试看78,mvn0-k=上课23'  -> 'ssmvnk'
str2 = 'ss试试看78,mvn0-k=上课23'
new_str2 = ''
for x in str2:
    if 97 <= ord(x) <= 122:
        new_str2 += x
print(new_str2)     # 'ssmvnk'

new_str2 = [x for x in str2 if 97 <= ord(x) <= 122]
print(new_str2)     # ['s', 's', 'm', 'v', 'n', 'k']

4)比较运算符

# 1)比较是否相等:==、!=
print('abc' == 'abc')       # True
print('abc' == 'acb')       # False

# 2)比较大小:>、<、>=、<=
# 两个字符串比较大小,比较的是第一对不相等的字符的编码值的大小
"""
char = ?
判断是否是数字字符: '0' <= char <= '9'
判断是否是小写字母: 'a' <= char <= 'z'
判断是否是大写字母: 'A' <= char <= 'Z'
判断是否是字母: 'a' <= char <= 'z' or 'A' <= char <= 'Z'
判断是否是中文: '\u4e00' <= char <= '\u9fa5'
"""
print('MNxy' > 'ab')        # False
print('你好吗' > 'hello')      # True
print('123' > 'KM123')      # False
print('M' > 'N')

# 练习2:
str3 = '你好loe--23=sks;M9JHkyu是-12山卡拉'

# 1)统计中文字符的个数
count = 0
for x in str3:
    if '\u4e00' <= x <= '\u9fa5':
        count += 1
print('中文个数:', count)

# 2)打印字符串中所有的数字字符
for x in str3:
    if '0' <= x <= '9':
        print(x)

# 3)提取字符串中所有的字母
new_str = ''
for x in str3:
    if 'a' <= x <= 'z' or 'A' <= x <= 'Z':
        new_str += x
print('所有的字母:', new_str)

5)in 和 not in

# 字符串1 in 字符串2  -  判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
print('1' in 'abc123')          # True
print('abc' in 'abc123')        # True
print(10 in [10, 20, 30])       # True
print([10, 20] in [10, 20, 30])     # False
print('ac' in 'abc123')     # False

6)r语法(r-string) - 在字符串的前面加r/R

如果在字符串前面加r,那么字符串中所有的转义字符的功能都会消失。(阻止转义)

str4 = r'\tabc\n12\'3\\'
print(str4)

path = R'c:\Users\name\test\a.txt'
print(path)

3.字符串相关操作

len(字符串)
str(数据)  -  将数据转换成字符串(任何类型的数据都可以转换成字符串;转换的时候是在数据的打印值的外面加引号)
eval(字符串)   -    去掉字符最外面的引号,获取数据(如果去掉引号后不是一个数据,就计算表达式的结果)
str(100)        # '100'
str(12.5)       # '12.5'
str([10, 20, 30])       # '[10, 20, 30]'
str([1,2,3])    # '[1, 2, 3]'
# print([1,2,3])      # [1, 2, 3]
str({'a': 10, 'b': 20})     # "{'a': 10, 'b': 20}"
str({'a': 10, "b": 20})     # "{'a': 10, 'b': 20}"
# print({'a': 10, "b": 20})     # {'a': 10, 'b': 20}
str(lambda x: x*2)          # '<function <lambda> at 0x10f49d430>'

result1 = eval('100')    # 100
print(result1, type(result1))       # 100 <class 'int'>

result2 = eval('[10, 20, 30]')        # [10, 20, 30]
print(result2, type(result2))         # [10, 20, 30] <class 'list'>

result3 = eval('10 + 20')
print(result3)      # 30

result4 = eval('type(10)')
print(result4)    # <class 'int'>


str5 = """{
    'student':[
        {'name': '小明', 'age': 18},
        {'name': '张三', 'age': 20},
    ],
    'name': 'python2104'
}"""
result4 = eval(str5)
print(result4, result4['student'][0])

abc = 200
print(eval('abc'))   # abc

a = b = 10
print(eval('a+b'))    # a + b

4.字符串相关方法

1)join

字符串.join(序列) - 将序列中的元素用指定的字符串拼接成一个字符串 (序列中的元素必须是字符串)

list1 = ['abc', 'name', '123', 'sdf']
result = ''.join(list1)
print(result)       # abcname123sdf

result1 = '+'.join(list1)
print(result1)      # abc+name+123+sdf

result2 = '123'.join('abc')
print(result2)      # 'a123b123c'

# 练习1:将list2中所有元素拼接成一个字符串
list2 = ['abc', 100, True, 'hello']     # 'abc100Truehello'
result3 = ''.join([str(x) for x in list2])
print(result3)      # abc100Truehello

# 练习2:将list2中所有的字符串拼接成一个字符串
list2 = ['abc', 100, True, 'hello']     # abchello
result4 = ''.join([x for x in list2 if type(x) == str])
print(result4)      # 'abchello'

2)count

字符串1.count(字符串2) - 统计字符串1中字符串2出现的次数

message = 'how are you? i am fine! thank you! and you?'
result5 = message.count('you')
print(result5)    # 3

3)index/find

字符串1.index(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的下标值)
字符串1.find(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的下标值)
在字符串2不存在的时候index会报错,find会不报错并且返回-1
rindex/rfind - 是从右往左找,找到的是最后一个字符串2

result6 = message.index('you')
print(result6)      # 8

result7 = message.find('you')
print(result7)      # 8

result8 = message.rfind('you')
print(result8)      # 39

4)split

字符串1.split(字符串2) - 将字符串1中所有的字符串2作为切割点对字符串1进行切割
字符串1.split(字符串2, N) - 最多切N次
注意:如果切割点怎么分布,切完后小字符串的个数都是切割点的数量加1

message = 'mnabc123abcxyzabcoop'
result9 = message.split('abc')
print(result9)      # ['mn', '123', 'xyz', 'oop']

message = 'abcmnabc123abcxyzabcabcoopabc'
print(message.split('abc'))     # ['', 'mn', '123', 'xyz', '', 'oop', '']

message = 'mnabc123abcxyzabcoop'
print(message.split('abc', 1))      # ['mn', '123abcxyzabcoop']

5)replace

字符串1.replace(字符串2, 字符串3) - 将字符串1中所有的字符串2都替换成字符串3
字符串1.replace(字符串2, 字符串3, N) - 只替换前N个

message = 'how are you? i am fine! thank you! and you?'
result10 = message.replace('you', 'me')
print(result10)     # how are me? i am fine! thank me! and me?

result11 = message.replace('you', 'me', 2)
print(result11)     # how are me? i am fine! thank me! and you?

6)center/rjust/ljust/zfill

字符串1.center(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居中显示
字符串1.rjust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居右显示
字符串1.ljust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居左显示
字符串1.zfill(长度) == 字符串1.rjust(长度, ‘0’)

str1 = 'abc'
print(str1.center(9, '0'))      # 000abc000
print(str1.center(8, 'x'))      # xxabcxxx
print(str1.rjust(9, '0'))       # 000000abc
print(str1.ljust(9, '0'))       # abc000000

# 3  -> 7
# xxabcxx
# abcxxxx
# xxxxabc
num = 9    # 009

7)strip/rstrip/lstrip

strip - 同时去掉字符串两边的所有的空白
rstrip - 去掉字符串右边的所有空白
lstrip - 去掉字符串左边的所有空白

str2 = '\t    abc 123   \n'
print('--------------原字符串--------------')
print(str2)
print('--------------去掉两边的字符串--------------')
print(str2.strip())
print('------------------------------------')
print(str2.lstrip())
print('------------------------------------')
print(str2.rstrip())
print('------------------------------------')

作业:

  1. 输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)

    例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**

    str1 = 'abcd1234 '
    str2 = ''
    for index in range(len(str1)):
        if index % 2:
            str2 += str1[index]
    print(str2)
    
  2. 输入用户名,判断用户名是否合法(用户名长度6~10位)

    user_name = input('请输入用户名:')
    if 6 <= len(user_name) <= 10:
        print('合法')
    else:
        print('不合法')
    
  3. 输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)

    例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法

    user_name = input('请输入用户名:')
    str_nums = 0
    for x in user_name:
        if 'a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9':
            str_nums += 1
    if str_nums == len(user_name):
        print('合法')
    else:
        print('不合法')
    
  4. 输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)

    例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法

    user_name = input('请输入用户名:')
    str_nums = 0
    if 'A' <= user_name[0] <= 'Z':
        for x in user_name:
            if 'a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9':
                str_nums += 1
        if str_nums == len(user_name):
            print('合法')
        else:
            print('不合法')
    else:
        print('不合法')
    
  5. 输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串

    例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’

    str1 = 'abc1shj23kls99+2kkk'
    print(''.join([x for x in str1 if '0' <= x <= '9']))
    
  6. 输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)

    例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'

    # upper方法:
    str1 = 'a2h2klm12+'
    print(str1.upper())
    # 自己写算法:
    str1 = 'a2h2klm12+'
    new_str1 = ''
    for x in str1:
        if 'a' <= x <= 'z':
            ord_x = ord(x) - 32
            new_str1 += chr(ord_x)
        else:
            new_str1 += x
    print(new_str1)
    
  7. 输入一个小于1000的数字,产生对应的学号

    例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**

    input1 = input('请输入用户名:')
    input2 = 'py1901' + input1.zfill(3)
    print(input2)
    
  8. 输入一个字符串,统计字符串中非数字字母的字符的个数

    例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3

    str1 = 'anc2+93-sj胡说'
    count = 0
    for x in str1:
        if not('a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9'):
            count += 1
    print(count)
    
  9. 输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串

    例如: 输入字符串**‘abc123’, 输出’+bc12+’**

    str1 = 'abc123'
    print(str1[1:-1].center(len(str1), '+'))
    
  10. 输入字符串,获取字符串的中间字符

例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**

str1 = 'abc1234'
if len(str1) % 2:
    print(str1[len(str1)//2])
else:
    print(str1[len(str1) // 2 - 1],str1[len(str1) // 2], sep='')
  1. 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8

str1 = 'how are you? Im fine, Thank you!'
str2 = 'you'
len_str2 = len(str2)
for x in range(len(str1)-len_str2 + 1):
    if str2 == str1[x:x + len_str2]:
        print(x)
        break
else:
    print(str1, '中不存在', str2)
  1. 获取两个字符串中公共的字符

例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

str1 = 'abc123'
str2 = 'huak3'
print('公共字符有:', ''.join([x for x in str1 if x in str2]))
  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值