python - 字符串和字符

最新推荐文章于 2024-06-12 07:27:50 发布

代码似诗

最新推荐文章于 2024-06-12 07:27:50 发布

阅读量1.2k

点赞数 2

分类专栏：基础语法 python学习文章标签： python 程序人生经验分享个人开发

本文链接：https://blog.csdn.net/qq_40692916/article/details/119007875

版权

基础语法同时被 2 个专栏收录

22 篇文章 0 订阅

订阅专栏

python学习

21 篇文章 0 订阅

订阅专栏

python - 字符串和字符

1.字符串(str)

1)什么是字符串

容器型数据类型；将’‘或者""或者’’’’’'或者""""""作为容器标志，引号中每个符号就是字符串的元素。
(’’’’’'和""""""在表示字符串内容的时候换行可以不使用转义字符，而是直接按回车)
字符串不可变(不支持增删改)；字符串有序(支持下标操作)
元素：引号中的单独的每个符号都是字符串的元素(又叫字符)，字符可以任何符号。
字符分为两类：普通字符(表示符号本身字符)、转义字符(符号的存在具有特殊的功能和意义)

str1 = '90,100'
str2 = "abc767=-=#%~时代峰峻"
str3 = 'abc\n123'
str4 = '''abc
          123'''
str5 = """abc
123
xy
"""
str6 = 'abc\n123'      # 'ABC123'
print(str6)

2）字符串的元素 - 字符

字符分为普通字符和转义字符两种
转义字符 - 在特定符号前加/让符号具备特殊的功能，常用转义字符如下：
\n - 换行
\t - 水平制表符（相当于tab键的功能）
’ - 表示一个普通的单引号
" - 表示一个普通的双引号
\ - 表示一个普通的反斜杠
一个转义符的长度是1
\u4位的字符编码值(4位的十六进制数) - 编码字符

str7 = '\tabc\n123'
print(str7)

str8 = 'it\'s me!'
print(str8)

str9 = "it's me!"
print(str9)

str10 = "I say:\"you see see, one day day!\""
print(str10)

str11 = 'I say:"you see see, one day day!"'
print(str11)

str12 = 'abc\\name\u4eff'
print(str12)   # abc\name仿

str13 = ''   # "",'''''',""""""
print(type(str13), len(str13))

2.字符编码

1）编码

计算机只能直接存储数字（而且保存的数字的二进制的补码），文字符号是无法直接存储到计算机中的。
为了能够让计算具备存储文字符号的能力，我们给所有的文字符号对应的一个固定的数字，每次要存储符号的时候就把符号对应的数字存起来。
符号对应的数字就是符号的编码值

2）编码表 - 保存符号和数字对应关系的表

① ASCII码表
a. 总共有128个字符（美国符号）
b. 数字在字母的前面；大写字母在小写字母前面；大写字母和小写字母之间有其他符号

② Unicode编码表（Python）
a. Unicode编码表是对ASCII表的扩展，包含了世界上所有的国家所有的民族所有语言的符号（又称万国码），总共：65536个
b. 中文范围：4e00 ~ 9fa5

③ 编码值在Python中的使用
a. chr函数： chr(编码值) - 获取编码值对应的字符
b. ord函数： ord(字符) - 获取字符的编码值
c. 编码字符： \u4e00 (4e00就是一个16进制的编码值)

注意：python中需要字符的地方都必须使用长度为1的字符串赋值

# 1) chr
print(chr(97))
print(chr(35), chr(0x23))
print(chr(0x4e00))   # 一
print(chr(0x9fa5))      # 龥

num = 0
for x in range(0x3040, 0x309f+1):
    print(chr(x), end=' ')
    num += 1
    if num % 30 == 0:
        print()

print()

# 2) ord
print(ord('子'), ord('明'))    # 23376 26126

# 练习：将大写字母转换成对应的小写字母
# A -> a，  M -> m
c = 'F'
new_c = chr(ord(c) + 32)
print(new_c)

str14 = 'abc\u5fdd-\u002b-\uA000'
print(str14)

3）查 - 获取字符串的字符

# 字符串获取字符的语法和列表获取元素的语法一模一样
str1 = '\tabc\n123\'+-'
print(str1[1])
print(str1[-1])
# print(str1[100])        # IndexError: string index out of range

print(str1[5:8], str1[5:-3])
print(str1[1:])
print(str1[::-1])

for x in str1:
    print(x)

for index in range(len(str1)):
    print(index, str1[index])

for index, item in enumerate(str1):
    print(index, item)

4）数学运算符：+、*

print('hello' + 'world!')   # helloworld!
print('hello' * 2)      # hellohello

name = '小明'
# 姓名: 小明
print('姓名: ' + name)

# 练习：提取字符中小写字母
# 'ss试试看78,mvn0-k=上课23'  -> 'ssmvnk'
str2 = 'ss试试看78,mvn0-k=上课23'
new_str2 = ''
for x in str2:
    if 97 <= ord(x) <= 122:
        new_str2 += x
print(new_str2)     # 'ssmvnk'

new_str2 = [x for x in str2 if 97 <= ord(x) <= 122]
print(new_str2)     # ['s', 's', 'm', 'v', 'n', 'k']

4）比较运算符

# 1）比较是否相等：==、!=
print('abc' == 'abc')       # True
print('abc' == 'acb')       # False

# 2）比较大小：>、<、>=、<=
# 两个字符串比较大小，比较的是第一对不相等的字符的编码值的大小
"""
char = ?
判断是否是数字字符： '0' <= char <= '9'
判断是否是小写字母： 'a' <= char <= 'z'
判断是否是大写字母： 'A' <= char <= 'Z'
判断是否是字母： 'a' <= char <= 'z' or 'A' <= char <= 'Z'
判断是否是中文： '\u4e00' <= char <= '\u9fa5'
"""
print('MNxy' > 'ab')        # False
print('你好吗' > 'hello')      # True
print('123' > 'KM123')      # False
print('M' > 'N')

# 练习2：
str3 = '你好loe--23=sks;M9JHkyu是-12山卡拉'

# 1）统计中文字符的个数
count = 0
for x in str3:
    if '\u4e00' <= x <= '\u9fa5':
        count += 1
print('中文个数:', count)

# 2）打印字符串中所有的数字字符
for x in str3:
    if '0' <= x <= '9':
        print(x)

# 3）提取字符串中所有的字母
new_str = ''
for x in str3:
    if 'a' <= x <= 'z' or 'A' <= x <= 'Z':
        new_str += x
print('所有的字母：', new_str)

5）in 和 not in

# 字符串1 in 字符串2  -  判断字符串2中是否包含字符串1（判断字符串1是否是字符串2的子串）
print('1' in 'abc123')          # True
print('abc' in 'abc123')        # True
print(10 in [10, 20, 30])       # True
print([10, 20] in [10, 20, 30])     # False
print('ac' in 'abc123')     # False

6）r语法（r-string） - 在字符串的前面加r/R

如果在字符串前面加r，那么字符串中所有的转义字符的功能都会消失。(阻止转义)

str4 = r'\tabc\n12\'3\\'
print(str4)

path = R'c:\Users\name\test\a.txt'
print(path)

3.字符串相关操作

len(字符串)
str(数据)  -  将数据转换成字符串（任何类型的数据都可以转换成字符串；转换的时候是在数据的打印值的外面加引号）
eval(字符串)   -    去掉字符最外面的引号，获取数据（如果去掉引号后不是一个数据，就计算表达式的结果）

str(100)        # '100'
str(12.5)       # '12.5'
str([10, 20, 30])       # '[10, 20, 30]'
str([1,2,3])    # '[1, 2, 3]'
# print([1,2,3])      # [1, 2, 3]
str({'a': 10, 'b': 20})     # "{'a': 10, 'b': 20}"
str({'a': 10, "b": 20})     # "{'a': 10, 'b': 20}"
# print({'a': 10, "b": 20})     # {'a': 10, 'b': 20}
str(lambda x: x*2)          # '<function <lambda> at 0x10f49d430>'

result1 = eval('100')    # 100
print(result1, type(result1))       # 100 <class 'int'>

result2 = eval('[10, 20, 30]')        # [10, 20, 30]
print(result2, type(result2))         # [10, 20, 30] <class 'list'>

result3 = eval('10 + 20')
print(result3)      # 30

result4 = eval('type(10)')
print(result4)    # <class 'int'>


str5 = """{
    'student':[
        {'name': '小明', 'age': 18},
        {'name': '张三', 'age': 20},
    ],
    'name': 'python2104'
}"""
result4 = eval(str5)
print(result4, result4['student'][0])

abc = 200
print(eval('abc'))   # abc

a = b = 10
print(eval('a+b'))    # a + b

4.字符串相关方法

1）join

字符串.join(序列) - 将序列中的元素用指定的字符串拼接成一个字符串（序列中的元素必须是字符串）

list1 = ['abc', 'name', '123', 'sdf']
result = ''.join(list1)
print(result)       # abcname123sdf

result1 = '+'.join(list1)
print(result1)      # abc+name+123+sdf

result2 = '123'.join('abc')
print(result2)      # 'a123b123c'

# 练习1：将list2中所有元素拼接成一个字符串
list2 = ['abc', 100, True, 'hello']     # 'abc100Truehello'
result3 = ''.join([str(x) for x in list2])
print(result3)      # abc100Truehello

# 练习2：将list2中所有的字符串拼接成一个字符串
list2 = ['abc', 100, True, 'hello']     # abchello
result4 = ''.join([x for x in list2 if type(x) == str])
print(result4)      # 'abchello'

2）count

字符串1.count(字符串2) - 统计字符串1中字符串2出现的次数

message = 'how are you? i am fine! thank you! and you?'
result5 = message.count('you')
print(result5)    # 3

3）index/find

字符串1.index(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的下标值)
字符串1.find(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的下标值)
在字符串2不存在的时候index会报错，find会不报错并且返回-1
rindex/rfind - 是从右往左找，找到的是最后一个字符串2

result6 = message.index('you')
print(result6)      # 8

result7 = message.find('you')
print(result7)      # 8

result8 = message.rfind('you')
print(result8)      # 39

4）split

字符串1.split(字符串2) - 将字符串1中所有的字符串2作为切割点对字符串1进行切割
字符串1.split(字符串2, N) - 最多切N次
注意：如果切割点怎么分布，切完后小字符串的个数都是切割点的数量加1

message = 'mnabc123abcxyzabcoop'
result9 = message.split('abc')
print(result9)      # ['mn', '123', 'xyz', 'oop']

message = 'abcmnabc123abcxyzabcabcoopabc'
print(message.split('abc'))     # ['', 'mn', '123', 'xyz', '', 'oop', '']

message = 'mnabc123abcxyzabcoop'
print(message.split('abc', 1))      # ['mn', '123abcxyzabcoop']

5）replace

字符串1.replace(字符串2, 字符串3) - 将字符串1中所有的字符串2都替换成字符串3
字符串1.replace(字符串2, 字符串3, N) - 只替换前N个

message = 'how are you? i am fine! thank you! and you?'
result10 = message.replace('you', 'me')
print(result10)     # how are me? i am fine! thank me! and me?

result11 = message.replace('you', 'me', 2)
print(result11)     # how are me? i am fine! thank me! and you?

6）center/rjust/ljust/zfill

字符串1.center(长度, 填充字符) - 将字符串1转换成指定长度的新字符串，不够的用指定字符填充，原字符串居中显示
字符串1.rjust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串，不够的用指定字符填充，原字符串居右显示
字符串1.ljust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串，不够的用指定字符填充，原字符串居左显示
字符串1.zfill(长度) == 字符串1.rjust(长度, ‘0’)

str1 = 'abc'
print(str1.center(9, '0'))      # 000abc000
print(str1.center(8, 'x'))      # xxabcxxx
print(str1.rjust(9, '0'))       # 000000abc
print(str1.ljust(9, '0'))       # abc000000

# 3  -> 7
# xxabcxx
# abcxxxx
# xxxxabc
num = 9    # 009

7）strip/rstrip/lstrip

strip - 同时去掉字符串两边的所有的空白
rstrip - 去掉字符串右边的所有空白
lstrip - 去掉字符串左边的所有空白

str2 = '\t    abc 123   \n'
print('--------------原字符串--------------')
print(str2)
print('--------------去掉两边的字符串--------------')
print(str2.strip())
print('------------------------------------')
print(str2.lstrip())
print('------------------------------------')
print(str2.rstrip())
print('------------------------------------')

作业：

输入一个字符串，打印所有奇数位上的字符(下标是1，3，5，7…位上的字符)

例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**
```
str1 = 'abcd1234 '
str2 = ''
for index in range(len(str1)):
    if index % 2:
        str2 += str1[index]
print(str2)
```

输入用户名，判断用户名是否合法(用户名长度6~10位)

user_name = input('请输入用户名：')
if 6 <= len(user_name) <= 10:
    print('合法')
else:
    print('不合法')

输入用户名，判断用户名是否合法(用户名中只能由数字和字母组成)

例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法

user_name = input('请输入用户名：')
str_nums = 0
for x in user_name:
    if 'a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9':
        str_nums += 1
if str_nums == len(user_name):
    print('合法')
else:
    print('不合法')

输入用户名，判断用户名是否合法(用户名必须包含且只能包含数字和字母，并且第一个字符必须是大写字母)

例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法

user_name = input('请输入用户名：')
str_nums = 0
if 'A' <= user_name[0] <= 'Z':
    for x in user_name:
        if 'a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9':
            str_nums += 1
    if str_nums == len(user_name):
        print('合法')
    else:
        print('不合法')
else:
    print('不合法')

输入一个字符串，将字符串中所有的数字字符取出来产生一个新的字符串

例如：输入**‘abc1shj23kls99+2kkk’** 输出：'123992’
```
str1 = 'abc1shj23kls99+2kkk'
print(''.join([x for x in str1 if '0' <= x <= '9']))
```

输入一个字符串，将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)

例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'

# upper方法:
str1 = 'a2h2klm12+'
print(str1.upper())
# 自己写算法:
str1 = 'a2h2klm12+'
new_str1 = ''
for x in str1:
    if 'a' <= x <= 'z':
        ord_x = ord(x) - 32
        new_str1 += chr(ord_x)
    else:
        new_str1 += x
print(new_str1)

输入一个小于1000的数字，产生对应的学号

例如: 输入**‘23’，输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’，输出’py1901123’**
```
input1 = input('请输入用户名：')
input2 = 'py1901' + input1.zfill(3)
print(input2)
```

输入一个字符串，统计字符串中非数字字母的字符的个数

例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3

str1 = 'anc2+93-sj胡说'
count = 0
for x in str1:
    if not('a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9'):
        count += 1
print(count)

输入字符串，将字符串的开头和结尾变成’+’，产生一个新的字符串

例如: 输入字符串**‘abc123’, 输出’+bc12+’**
```
str1 = 'abc123'
print(str1[1:-1].center(len(str1), '+'))
```
输入字符串，获取字符串的中间字符

例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**

str1 = 'abc1234'
if len(str1) % 2:
    print(str1[len(str1)//2])
else:
    print(str1[len(str1) // 2 - 1],str1[len(str1) // 2], sep='')

写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8

str1 = 'how are you? Im fine, Thank you!'
str2 = 'you'
len_str2 = len(str2)
for x in range(len(str1)-len_str2 + 1):
    if str2 == str1[x:x + len_str2]:
        print(x)
        break
else:
    print(str1, '中不存在', str2)

获取两个字符串中公共的字符

例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

str1 = 'abc123'
str2 = 'huak3'
print('公共字符有:', ''.join([x for x in str1 if x in str2]))

代码似诗

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
python - 字符串和字符

python - 字符串和字符1.字符串(str)1)什么是字符串容器型数据类型；将’‘或者""或者’’’’’'或者""""""作为容器标志，引号中每个符号就是字符串的元素。(’’’’’'和""""""在表示字符串内容的时候换行可以不使用转义字符，而是直接按回车)字符串不可变(不支持增删改)；字符串有序(支持下标操作)元素：引号中的单独的每个符号都是字符串的元素(又叫字符)，字符可以任何符号。字符分为两类：普通字符(表示符号本身字符)、转义字符(符号的存在具有特殊的功能和意义)str1 =
复制链接

扫一扫