数据结构-字符串_字符串用什么符号表示-CSDN博客

本文链接：https://blog.csdn.net/sinat_26916241/article/details/140201228

字符串

什么是字符串？

字符串是在任何编程语言中都非常重要的一种数据类型。

在 Python 中，字符串是由引号包裹的任意字符组成的不可变序列，用于表示文本类型数据。

字符串定义

字符串可以通过使用 单引号 或 双引号 或 三引号 来定义，用于表示文本信息，如姓名、消息等。

# 使用单引号定义字符串：
name = 'Alice'
# 使用双引号定义字符串：
message = "Hello, world!"
# 使用三引号定义字符串
sql_string = """select * from user where name='tom';"""

转义字符

转义字符在字符串中用于表示一些特殊字符或序列，以及插入难以直接输入的字符。

常见的转义字符包括：\n 表示换行符，\t 表示制表符，\" 表示双引号，\' 表示单引号，\\ 表示反斜杠。

通过使用转义字符，可以在字符串中插入特殊字符或表示这些无法直接输入的内容。

message = "Hello\nWorld!"
print(message)

# output:
# Hello
# World!

字符串下标

下标是指从 0 开始的数字编号，也称为索引。

在字符串中，每一个字符都会对应一个下标，通过下标可以获取字符串中该下标对应的字符

语法格式：字符串对象[下标]

s = "hello"
print(s[0])
print(s[3])
print(s[5]) # 该行代码会报错

注意: 下标在使用时，不能大于等于该字符串所有字符的个数，否则会产生下标越界错误。

练习：

编写一个Python程序，输入一个5位数，判断输入的这个数字是否为回文数。回文数是指从左到右和从右到左读都一样的数。例如12321。如果输入的是回文数，输出是回文数，否则输出不是回文数。

实现方式：

def is_palindrome():
    num = input("请输入一个5位数：")        # 通过 input 函数获取用户输入的字符串，并将其赋值给变量 num
    if num == num[::-1]:                # 使用切片 [::-1] 反转字符串，然后将反转后的字符串与原始字符串进行比较。如果它们相等，说明这个数是回文数
        print(f"{num} 是一个回文数！")
    else:
        print(f"{num}不是一个回文数！")

is_palindrome()

字符串操作

字符串是在每一门编程语言中都非常重要的数据类型，同时对于字符串也提供了丰富的操作函数。

下面将 Python 中提供的字符串常用函数进行分类讲解

注意：

所有的字符串操作，都不会影响原字符串本身，每次操作后都会得到一个操作后的新字符串对象

统计查找替换类

len() 用来获取参数字符串的字符个数，该函数并不是字符串类型特有的，而是一个通用函数

格式： len(obj)
```
  length = len("Hello")
  print(length)
  length = len("Hello World")
  print(length)
```

count() 返回 str 在 string 里面出现的次数，如果 start 或者 end 指定则返回指定范围内 str 出现的次数
格式： count(str, start, end)
```
s = "hello world hello Python"
n = s.count("o")
print(n)
n = s.count("O")
print(n)
n = s.count("or")
print(n)
n = s.count("o",10,30)
print(n)
```

index() 检测 sub 是否包含在 string 中，如果 start 和 end 指定范围，则检查是否包含在指定范围内，如果是返回开始的索引值，否则抛出一个异常
格式： index(sub, start, end)
```
s = "Hello"
print(s.index("l"))
print(s.index("l",0,3)) # 区间使用下标位置，左闭右开区间
print(s.index("k"))
```

rindex() 作用同 index(),查找子串时从右侧查找，若找不到会抛出一个异常
格式： rindex(sub, start, end)
```
s = "Hello"
print(s.rindex("l"))
print(s.rindex("l",0,3))
print(s.rindex("k"))
```

find() 检测 sub 是否包含在 string 中，如果 start 和 end 指定范围，则检查是否包含在指定范围内，如果是返回开始的索引值，否则返回 -1
格式： find(sub, start, end)
```
s = "Hello"
print(s.find("l"))
print(s.find("l",0,3))
print(s.find("k"))
```

rfind() 作用同 find(),查找子串时从右侧查找，若找不到返回 -1
格式： rfind(sub, start, end)
```
s = "Hello"
print(s.rfind("l"))
print(s.rfind("l",0,3))
print(s.rfind("k"))
```

replace() 把 string 中的 old 替换成 new,如果 max 指定，则替换不超过 max 次.
格式： replace(old, new, max)
```
s = "Hello Hello Hello"
print(s.replace("ll","LL"))
print(s.replace("l","L",4))
```

字符串判断类

startswith() 检查字符串是否是以 prefix 开头，是则返回 True，否则返回 False。如果 start 和 end 指定值，则在指定范围内检查.
格式： startswith(prefix, start, end)
```
url = "https://www.baidu.com"
print(url.startswith("https://"))
print(url.startswith("https://", 0, 3))
print(url.startswith("https://", 5, 30))
```

endswith() 检查字符串是否是以 suffix 结束，是则返回 True，否则返回 False。如果 start 和 end 指定值，则在指定范围内检查.
格式： endswith(suffix, start, end)
```
url = "https://www.baidu.com"
print(url.endswith(".com"))
print(url.endswith(".com", 0, 20))
print(url.endswith(".com", 5, 30))
```

isalpha() 如果 string 至少有一个字符并且所有字符都是字母则返回 True, 否则返回 False

格式： isalpha()

print("abc".isalpha())
print("ABC".isalpha())
print("ABCabc".isalpha())
print("123".isalpha())
print("a b".isalpha())
print("abc123".isalpha())
print("123abc".isalpha())
print("a@".isalpha())
print("".isalpha())

isdigit() 如果 string 只包含数字则返回 True 否则返回 False.

格式： isdigit()

print("123".isdigit())
print("123abc".isdigit())
print("abc123".isdigit())
print("".isdigit())

isalnum() 如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True ,否则返回 False

格式： isalnum()

print("abc".isalnum())
print("ABC".isalnum())
print("ABCabc".isalnum())
print("123".isalnum())
print("abc123".isalnum())
print("123abc".isalnum())
print("a b".isalnum())
print("a@".isalnum())
print("".isalnum())

isspace() 如果 string 中只包含空格，则返回 True，否则返回 False.

格式： isspace()

print(" ".isspace())
print("    ".isspace()) # tab键，由4个空白组成
print("\t".isspace())
print("\n".isspace())
print("\r".isspace())
print("".isspace())
print(" a".isspace())
print("1 ".isspace())

isupper() 如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，则返回 True，否则返回 False

格式： isupper()

print("ABC".isupper())
print("ABC123".isupper())
print("123ABC".isupper())
print("A!@#B".isupper())
print("abc".isupper())
print("abC".isupper())
print("abc123".isupper())
print("Abc!@#".isupper())
print("123".isupper())
print("".isupper())
print(" ".isupper())

islower() 如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是小写，则返回 True，否则返回 False

格式： islower()

print("abc".islower())
print("abc123".islower())
print("ABC".islower())
print("abC".islower())
print("Abc!@#".islower())
print("123".islower())
print("".islower())
print(" ".islower())

istitle() 如果 string 是标题化的（所有单词首字符是大写）则返回 True，否则返回 False

格式： istitle()

print("Username".istitle())
print("User Name".istitle())
print("User_Name".istitle())
print("User.Name".istitle())
print("User+Name".istitle())
print("username".istitle())
print("UserName".istitle())
print("user name".istitle())
print("User name".istitle())

字符串转换类

capitalize() 把字符串的第一个字符大写

格式： capitalize()

print("username".capitalize())
print("Username".capitalize())
print("userNAME".capitalize())
print("this is username".capitalize())

title() 返回标题化的 string，就是说所有单词都是以大写开始，其余字母均为小写
格式： title()
```
print("this is username".title())
print("THIS IS USERNAME".title())
print("tHIS IS username".title())
```

upper() 转换 string 中的小写字母为大写

格式： upper()

print("abc".upper())
print("ABC".upper())
print("abCd".upper())
print("abc123".upper())
print("abc123ABC".upper())

lower() 转换 string 中的小写字母为小写

格式： lower()

print("abc".lower())
print("ABC".lower())
print("abCd".lower())
print("abc123".lower())
print("abc123ABC".lower())

字符串对齐类

center() 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串，如果指定 fillchar 参数，则使用指定字符填充，fillchar 参数长度只能为 1
格式： center(width, fillchar)
```
print("|"+"sinocare".center(20) + "|")
print("|"+"sinocare".center(5) + "|")
print("|"+"sinocare".center(20, "-") + "|")
```

ljust() 返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串，如果指定 fillchar 参数，则使用指定字符填充，fillchar 参数长度只能为 1
格式： ljust(width, fillchar)
```
print("|"+"sinocare".ljust(20) + "|")
print("|"+"sinocare".ljust(5) + "|")
print("|"+"sinocare".ljust(20, "-") + "|")
```

rjust() 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串，如果指定 fillchar 参数，则使用指定字符填充，fillchar 参数长度只能为 1
格式： rjust(width, fillchar)
```
print("|"+"sinocare".rjust(20) + "|")
print("|"+"sinocare".rjust(5) + "|")
print("|"+"sinocare".rjust(20, "-") + "|")
```

字符串去除空白类

strip() 删除 string 左右两侧的空白字符, 如果指定 chars 参数，则删除左右两侧指定的字符

格式： strip(chars)

print("|" + "  sinocare " + "|")
print("|" + "  sinocare  ".strip() + "|")
print("|" + "  sinocare".strip() + "|")
print("|" + "sinocare  ".strip() + "|")
print("|" + " S i n c a r e s  ".strip() + "|")
print("|" + "bachogwortsabc".strip("cba") + "|")

lstrip() 删除 string 左边的空白字符, 如果指定 chars 参数，则删除左两侧指定的字符

格式： lstrip(chars)

print("|" + "  sinocare  " + "|")
print("|" + "  sinocare ".lstrip() + "|")
print("|" + "  sinocare".lstrip() + "|")
print("|" + "sinocare  ".lstrip() + "|")
print("|" + "  s i n o c a r e  ".lstrip() + "|")
print("|" + "bachogwortsabc".lstrip("cba") + "|")

rstrip() 删除 string 左边的空白字符, 如果指定 chars 参数，则删除右两侧指定的字符

格式： rstrip(chars)

print("|" + "  sinocare  " + "|")
print("|" + "  sinocare ".rstrip() + "|")
print("|" + "  sinocare".rstrip() + "|")
print("|" + "sinocare  ".rstrip() + "|")
print("|" + "  s i n o c a r e  ".rstrip() + "|")
print("|" + "bachogwortsabc".rstrip("cba") + "|")

字符串分割类

split() 以 sep 为分隔符分割 string ，如果指定 maxsplit 参数，则仅分割 maxsplit 次

格式： split(sep, maxsplit)

print("a-b-c-d".split("-"))
print("a-b-c-d".split("-", 2))
print("a--b-c-d".split("-"))
print("a-+b-c-d".split("-+"))
print("a b\tc\nd\re".split())
print("a b c d e".split(" ", 3))

splitlines() 使用换行符\n分割 string，如果指定 keepends 参数，则结果中会保留\n符号
格式： splitlines(keepends)
```
print("a\nb\nc".splitlines())
print("a\nb\nc".splitlines(True))
```

partition() 从 sep 出现的第一个位置起,把 string 分成一个 3 元素的元组 (string_pre_sep,sep,string_post_sep)，如果 string 中不包含 sep 则 string_pre_str == string，其余元素为空字符串
格式： partition(sep)
```
print("This is sinocare".partition("is"))
print("This is sinocare".partition("iss"))
```

rpartition() 从右向左 sep 出现的第一个位置起,把 string 分成一个 3 元素的元组 (string_pre_sep,sep,string_post_sep)，如果 string 中不包含 sep 则 string_post_str == string，其余元素为空字符串
格式： rpartition(sep)
```
print("This is Hogworts".rpartition("is"))
print("This is Hogworts".rpartition("iss"))
```

字符串连接类

+号 将两个字符串连接生成一个新字符串, + 号两侧必须都是字符串
格式： str1 + str2
```
print("Hello" + "World")
print("Hello" + "123")
print("Hello" + 123)
```

*号 将字符串重复 N 次后生成一个新字符串
格式： str * n
```
print("*"* 10)
print("hello"* 10)
```

join() 使用 string 连接可迭代对象中的所有元素，可迭代对象参数中的所有元素必须是字符串

格式： join(iterable)

print("".join(("a","b","c")))
print("-".join(("a","b","c")))
print("->".join(("a","b","c")))
print("->".join(["a","b","c"]))
print("->".join({"a","b","c"}))
print("->".join({"a":"A","b":"B","c":"C"}))

编码解码类

encode() 使用 encoding 指定的字符集，对 string 进行编码，转换成二进制字符串

格式： encode(encoding)

print("abc123".encode("gbk"))
print("你好".encode("gbk"))

print("abc123".encode("utf-8"))
print("你好".encode("u8"))

decode() 使用 encoding 指定的字符集，对 string 进行解码，转换成字符串对象， string 必须是二进制字符串

格式： decode(encoding)

s1 = b'\xc4\xe3\xba\xc3'
s2 = b'\xe4\xbd\xa0\xe5\xa5\xbd'
print(s1.decode("gbk"))
print(s2.decode("utf-8"))

# print(s1.decode("u8"))
# print(s2.decode("gbk"))

切片操作

对字符串按指定的范围进行截取，得到一个子字符串，指定范围时，起始下标必须小于结束下标，且子字符串不包含结束下标

格式： str[start: end: step]

s = "abcdefg"

# 普通切片
print(s[0: 2])
# 省略范围
print(s[0:])
print(s[: 2])
print(s[:])
# 指定步长
print(s[::1])
print(s[::2])
# 负下标
print(s[-3: -1])
# 负步长
print(s[-1: -3: -1])
# 逆序
print(s[::-1])

# 字符串的定义
def string_info():
    s1 = 'hello'
    print('hello')
    print(s1)
    print(type(s1))
    # 使用双引号定义字符串
    s2 = "你好 python!"
    print(s2)
    print(type(s2))
    # 使用三引号定义字符串
    s3 = 'select * from user where name="Tom"'
    s4 = """select * from user where name="Tom";"""
    s5 = '''select * from user where name='Tom'''''
    s6 = """select * from user where name='Tom';"""
    print(s3, s4, s5, s6)
    print(type(s3), type(s4), type(s5), type(s6))

    print("hello\nworld")  # 换行符
    s7 = '''select * from user where name='Tom\''''  # 转义字符
    print(s7)
    path1 = "c:\\python\\bin\\python.exe"
    path2 = "c:/python/bin/python.exe"
    print(path1, path2)

    s = "HelloWorld"
    # 字符串下标
    print(s[0])  # H
    print(s[5])  # W
    print(s[9])  # d

string_info()