字符串与相关操作

一、字符串基础

1.什么是字符串(str)
“”"
字符串是容器型数据类型,将单引号或者双引号作为容器的标志,元素不需要用逗号隔开:‘元素1元素2元素3…’
字符串是不可变的(不支持增删改),字符串是有序的(支持下标操作)

字符串中的元素:只能是文本符号(所有计算机能表达出来的符号都可以作为字符串的元素),一个符号对应一个元素

字符串中每一个独立的元素又叫’字符’,python中只有字符的概念,没有字符对应的数据类型
“”"

空串

str1 = ''
str2 =""
str3 = """"""
print(type(str1), type(str2), type(str3))

非空字符串

str1 = 'abc'
str2 ="你好"
str3 = """hello,你好"""

2.字符(字符串中的元素)
‘’
字符串中的字符分两种:普通字符,转义字符
1)普通字符 - 除了转义字符以外的字符
2)转义字符 - 在指定符号前加\用来表示一些特殊功能和特殊意义的字符
\n - 换行
\t - 制表符(按tab键)
’ - 单引号
" - 双引号
\ - 反斜杠
“”"
编码字符:\u4位的16进制数

str4 = '\u4e00abc\u7800'
print(str4, len(str4))

注意:计算转义字符长度的时候,一个转义字符的长度是1

3)阻止转义
在字符串的最前面加r/R,那么这个字符串中的所有转义字符都无效

应用1:windows路径

path = r'c\nan\temp'
print(path)

二、字符编码

1.什么是字符编码
计算机在存数据的时候只能存数字,而且存的数字是补码

为了能够让计算机存储文本数据,给每个字符关联了一个固定的数字,用来对这个字符进行存储,每个字符关联的那个数字就是这个字符的编码值

2.编码表

1)ASCII码标:用1个字节来对字符进行编码(码值范围:0 - 127)
a.数字在字母前面(字符0 - 字符9的编码值连续递增)
b.大写字母在小写字母前面(字母之间连续递增)
c.大写字母和小写字母之间有其他符号(不是连续的)

2)Unicode编码标
Unicode编码标是对ASCII码标的扩展(Unicode编码标中包含了ASCII编码标中所有的符号)
Unicode编码标中包含了世界上所有国家所有民族所有语言的符号,总共65536个
中文范围:4e00 - 9fa5

1)chr函数

chr(编码值) - 获取指定编码值对应的字符

打印所有的中文

count = 0
for x in range(0x4e00,0x9fa5):
    print(chr(x), end=' ')
    count += 1
    if count % 50 == 0:
        print()
print()

2)ord函数

ord(字符) - 获取指定字符对应的编码值
print(ord('亮'))

3)编码字符

str4 = '\u4e00你好!'
print(str4)

三、字符串相关操作

1.获取字符串中的元素(获取字符)
字符串获取元素和列表获取元素的语法一样

str1 = 'how are you!'
1)获取单个元素
print(str1[2])
print(str1[-1])
2)切片
print(str1[1:5])     # 'ow a'
print(str1[-3::-1])     # 'oy era woh'
3)遍历
for x in str1:
    print(x)
    
for index in range(len(str1)):
    print(str1[index])

2.+, *

字符串1 + 字符串2
字符串 * N / N * 字符串

str1 = 'abc'
str2 = '123'
print(str1 + str2)      # 'abc123'
print(str1 * 2)     # 'abcabc'

3.==!=
print(str1 == 'abc')        # True
print(str1 == 'bca')        # False

4.>, <, >=, <=(针对两个字符串)

两个字符串比较大小:比较的是第一组不相等的字符的编码值大小

str3 = 'zABC'
str4 = 'z1abc'
print(str3 > str4)      # True

应用:
判断是否是数字字符:‘0’ <= char <= ‘9’
判断是否是小写字母:‘a’ <= char <= ‘z’
判断是否是大写字母:‘A’ <= char <= ‘Z’
判断是否是字母:‘a’ <= char <= ‘z’ or ‘A’ <= char <= ‘Z’
判断是否是中文字符:’\u4e00’ <= char <= ‘\u9fa5’

练习1:输入一个字符串,统计字符串中字母和中文的个数

str5 = 'Hello,王红亮'
count1 = 0
count2 = 0
for x in str5:
    if 'a' <= x <= 'z'or 'A' <= x <= 'Z':
        count1 += 1
    elif '\u4e00' <= x <= '\u9fa5':
        count2 += 1
print('字母个数:', count1, '中文个数:', count2)

练习2:判断输入的字符串是否是纯数字字符串

str6 = '242142'
for y in str6:
    if not('0' <= y <= '9'):
        print('字符串不是纯数字')
        break
else:
    print('字符串是纯数字')

5.in 和 not in

字符串1 in 字符串2 - 判断字符串1收否是字符串2的子串

print('abc' in 'acbnm')     # False
print('abc' in 'abcnm')     # True
print('a' in 'abc')     # True

6.相关函数

max/min/sorted/reversed等,这些函数都适用于字符串
len(字符串) - 求字符串的长度

str(数据) - 将自定数据转换成字符串
a.所有的数据都可以转换成字符串
b.将数据的打印值作为字符串的内容

str7 = r'\tabc'
print(len(str7))        # 5

num = 100
print([str(num)])     # ['100']

四、字符串相关方法

1.center/rjust/ljust/zfill

字符串.center(长度,填充字符) - 产生一个新的字符串:长度是指定长度,原字符串在新字符串中间,左右用指定字符填充
字符串.ljust(长度,填充字符) - 产生一个新的字符串:长度是指定长度,原字符串在新字符串左边,右边用指定字符填充
字符串.rjust(长度,填充字符) - 产生一个新的字符串:长度是指定长度,原字符串在新字符串右边,左边用指定字符填充
字符串.zfill(长度) == 字符串.rjust(长度,‘0’)

str1 = 'abc'
new_str1 = str1.center(7, 'x')
print(new_str1)     # xxabcxx

new_str2 = str1.ljust(7, '#')
print(new_str2)     # abc####

new_str3 = str1.rjust(7, '*')
print(new_str3)     # ****abc

练习:给任意一个商品的数字编号值,转换成固定格式的商品编码:GDXXXX -> GD0001, GD0002,…

num = 34
new_str = 'GD' + str(num).zfill(4)
print(new_str)

2.replace

字符串1.replace(字符串2, 字符串3) - 将字符串1中所有的字符串2全部替换成字符3
字符串1.replace(字符串2, 字符串3,N) - 将字符串1中的前N个字符串2替换成字符3

str1 = 'how are you? i am fine, thank you!'
new_str4 = str1.replace('o', '*')
print(new_str4)     # 'h*w are y*u? i am fine, thank y*u!'

new_str5 = str1.replace('o', '$', 2)
print(new_str5)     # 'h$w are y$u? i am fine, thank you!'
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值