08 Python - 字符串和字符串相关的操作

最新推荐文章于 2023-02-06 10:03:21 发布

plyzz

最新推荐文章于 2023-02-06 10:03:21 发布

阅读量337

点赞数 3

分类专栏： python 文章标签： python 字符串

本文链接：https://blog.csdn.net/plyzz/article/details/106845628

版权

python 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

字符串和字符串相关的操作

1.字符串(str)?

字符串是容器型数据类型,将单引号或双引号作为容器的标志,元素不需要用逗号隔开
字符串是不可变的(不支持增删改)
字符串是有序的(支持下标操作)
字符串中每一个独立的元素又叫:字符, python中只有字符的概念,但是没有字符对应的数据类型

① 空串 :

str1 = ''
str2 = ""
str3 = ''''''
str4 = """"""

② 非空字符串:

str1 = 'abc'
str2 = "你好"
str3 = '''你好,hello'''
str4 = """123，嗨"""

字符(字符串中的元素)

字符串中的字符分为两种: 普通字符、转义字符
- 普通字符 - 除了转义字符串以外的字符
- 转义字符 - 在指定符号前加\用来表示一些特殊功能和特殊意义的字符
  - \n - 换行
  - \t - 制表符(按tab键)
  - \’ - 单引号
  - \" - 双引号
  - \\ - 反斜杠
- 编码字符

str1 = '\tabc\n123'
print(str1)

str2 = 'abc\'123'   # abc'123
str3 = "abc\"123"   # abc"123
str4 = 'abc\\n123'  # abc\n123
print(str4)

str5 = '\u4e00你好!\u7800'
# 这儿 \u4e00 和 \u7800 都是转义字符中的编码字符
print(str5, len(str5))   # 一你好!砀

**注意:**计算字符串长度的时候，一个转义字符的长度是1

阻止转义: 在字符串的最前面加 r/R ，那么这个字符串中的所有的转义字符都无效
- 应用: windows 路径 , 正则表达式（这里就不详细说明了）

str6 = r'\tabc\n123\u4e00'
print(str6)    # \tabc\n123\u4e00

3.字符编码

计算机在存储数据的时候只能存数字,而且存德是数字的补码，为了能够让计算机存储文本数据,给每个字符关联了一个固定的数字,用来对这个字符进行存储。每个字符关联的那个数字就是这个字符的编码值
编码表
① ASCII码表:用一个字节来对字符进行编码(码值范围:0~127)
- 数字在字母的前面 (字符0~字符9的编码值连续递增)
- 大写字母在小写字母前面(字母直接是连续递增)
- 大写字母和小写字母之间有其它的符号(不连续)
②Unicode编码表：
- Unicode编码表是对ASCII表的扩展(Unicode编码表中包含了ASCII表中所有的符号)
- Unicode编码表中包含了世界上所有国家所有民族所有的语言的符号,总共有65536个
- 中文范围:4e00 ~ 9fa5
chr 函数
- chr(编码值) - 获取指定编码值对应的字符

# 打印所有的中文
count = 0
for x in range(0x4e00, 0x9fa5):
    print(chr(x), end=' ')
    count += 1
    if count % 40 == 0:
        print()
print()

ord 函数
- ord(字符) - 获取指定字符对应的编码值

print(ord('盲'),ord('僧')) # 30450  20711

编码字符

str1 = '\u4e00你好！'
print(str1)  # 一你好

4.字符串相关操作

获取字符串中的元素 (获取字符)
- 字符串获取元素和列表获取元素的语法一样
  - ①获取单个元素（下标获取）② 切片
  - ③ 遍历
  - 字符串可以进行 + 和 * 操作
  - 字符串1+字符串2
  - 字符串 * N 或者 N * 字符串（N是正整数）

str1 = 'abc'
str2 = '123'
print(str1 + str2)     # abc123
print(str1 * 2)        # abcabc

== 和 !=

print(str1 == 'abc')     # True
print(str1 == 'bac')     # False

<, >=, <= 运算 (针对两个字符串)
两个字符串比较大小:比较的是第一组不相等的字符的编码值的大小

str3 = 'zABC'
str4 = 'z1bcd'
print(str3 > str4)     # True

应用:

判断是否是数字字符: ‘0’ <= char <= ‘9’
- 判断是否是小写字母：‘a’ <= char <= ‘z’
- 判断是否是大写字母：‘A’ <= char <= ‘Z’
- 判断是否是字母：‘a’ <= char <= ‘z’ or ‘A’ <= char <= ‘Z’
- 判断是否是中文字符： ‘\u4e00’ <= char <= ‘\u9fa5’