数据结构-字符串

字符串

什么是字符串?

字符串是在任何编程语言中都非常重要的一种数据类型。

在 Python 中,字符串是由引号包裹的任意字符组成的不可变序列,用于表示文本类型数据。

字符串定义

字符串可以通过使用 单引号 或 双引号 或 三引号 来定义,用于表示文本信息,如姓名、消息等。

# 使用单引号定义字符串:
name = 'Alice'
# 使用双引号定义字符串:
message = "Hello, world!"
# 使用三引号定义字符串
sql_string = """select * from user where name='tom';"""

转义字符

转义字符在字符串中用于表示一些特殊字符或序列,以及插入难以直接输入的字符。

常见的转义字符包括:\n 表示换行符,\t 表示制表符,\" 表示双引号,\' 表示单引号,\\ 表示反斜杠。

通过使用转义字符,可以在字符串中插入特殊字符或表示这些无法直接输入的内容。

message = "Hello\nWorld!"
print(message)

# output:
# Hello
# World!

字符串下标

下标是指从 0 开始的数字编号,也称为索引。

在字符串中,每一个字符都会对应一个下标,通过下标可以获取字符串中该下标对应的字符

语法格式:字符串对象[下标]

s = "hello"
print(s[0])
print(s[3])
print(s[5]) # 该行代码会报错

注意: 下标在使用时,不能大于等于该字符串所有字符的个数,否则会产生下标越界错误。

练习:

编写一个Python程序,输入一个5位数,判断输入的这个数字是否为回文数。回文数是指从左到右和从右到左读都一样的数。例如12321。如果输入的是回文数,输出是回文数,否则输出不是回文数。

实现方式:

def is_palindrome():
    num = input("请输入一个5位数:")        # 通过 input 函数获取用户输入的字符串,并将其赋值给变量 num
    if num == num[::-1]:                # 使用切片 [::-1] 反转字符串,然后将反转后的字符串与原始字符串进行比较。如果它们相等,说明这个数是回文数
        print(f"{num} 是一个回文数!")
    else:
        print(f"{num}不是一个回文数!")

is_palindrome()

字符串操作

字符串是在每一门编程语言中都非常重要的数据类型,同时对于字符串也提供了丰富的操作函数。

下面将 Python 中提供的字符串常用函数进行分类讲解

注意

所有的字符串操作,都不会影响原字符串本身,每次操作后都会得到一个操作后的新字符串对象

统计查找替换类

  • len() 用来获取参数字符串的字符个数,该函数并不是字符串类型特有的,而是一个通用函数

    格式: len(obj)

      length = len("Hello")
      print(length)
      length = len("Hello World")
      print(length)
    
  • count() 返回 str 在 string 里面出现的次数,如果 start 或者 end 指定则返回指定范围内 str 出现的次数

    格式: count(str, start, end)

    s = "hello world hello Python"
    n = s.count("o")
    print(n)
    n = s.count("O")
    print(n)
    n = s.count("or")
    print(n)
    n = s.count("o",10,30)
    print(n)
    
  • index() 检测 sub 是否包含在 string 中,如果 start 和 end 指定范围,则检查是否包含在指定范围内,如果是返回开始的索引值,否则抛出一个异常

    格式: index(sub, start, end)

    s = "Hello"
    print(s.index("l"))
    print(s.index("l",0,3)) # 区间使用下标位置,左闭右开区间
    print(s.index("k"))
    
  • rindex() 作用同 index(),查找子串时从右侧查找,若找不到会抛出一个异常

    格式: rindex(sub, start, end)

    s = "Hello"
    print(s.rindex("l"))
    print(s.rindex("l",0,3))
    print(s.rindex("k"))
    
  • find() 检测 sub 是否包含在 string 中,如果 start 和 end 指定范围,则检查是否包含在指定范围内,如果是返回开始的索引值,否则返回 -1

    格式: find(sub, start, end)

    s = "Hello"
    print(s.find("l"))
    print(s.find("l",0,3))
    print(s.find("k"))
    
  • rfind() 作用同 find(),查找子串时从右侧查找,若找不到返回 -1

    格式: rfind(sub, start, end)

    s = "Hello"
    print(s.rfind("l"))
    print(s.rfind("l",0,3))
    print(s.rfind("k"))
    
  • replace() 把 string 中的 old 替换成 new,如果 max 指定,则替换不超过 max 次.

    格式: replace(old, new, max)

    s = "Hello Hello Hello"
    print(s.replace("ll","LL"))
    print(s.replace("l","L",4))
    

字符串判断类

  • startswith() 检查字符串是否是以 prefix 开头,是则返回 True,否则返回 False。如果 start 和 end 指定值,则在指定范围内检查.

    格式: startswith(prefix, start, end)

    url = "https://www.baidu.com"
    print(url.startswith("https://"))
    print(url.startswith("https://", 0, 3))
    print(url.startswith("https://", 5, 30))
    
  • endswith() 检查字符串是否是以 suffix 结束,是则返回 True,否则返回 False。如果 start 和 end 指定值,则在指定范围内检查.

    格式: endswith(suffix, start, end)

    url = "https://www.baidu.com"
    print(url.endswith(".com"))
    print(url.endswith(".com", 0, 20))
    print(url.endswith(".com", 5, 30))
    
  • isalpha() 如果 string 至少有一个字符并且所有字符都是字母则返回 True, 否则返回 False

    格式: isalpha()

    print("abc".isalpha())
    print("ABC".isalpha())
    print("ABCabc".isalpha())
    print("123".isalpha())
    print("a b".isalpha())
    print("abc123".isalpha())
    print("123abc".isalpha())
    print("a@".isalpha())
    print("".isalpha())
    
  • isdigit() 如果 string 只包含数字则返回 True 否则返回 False.

    格式: isdigit()

    print("123".isdigit())
    print("123abc".isdigit())
    print("abc123".isdigit())
    print("".isdigit())
    
  • isalnum() 如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True ,否则返回 False

    格式: isalnum()

    print("abc".isalnum())
    print("ABC".isalnum())
    print("ABCabc".isalnum())
    print("123".isalnum())
    print("abc123".isalnum())
    print("123abc".isalnum())
    print("a b".isalnum())
    print("a@".isalnum())
    print("".isalnum())
    
  • isspace() 如果 string 中只包含空格,则返回 True,否则返回 False.

    格式: isspace()

    print(" ".isspace())
    print("    ".isspace()) # tab键,由4个空白组成
    print("\t".isspace())
    print("\n".isspace())
    print("\r".isspace())
    print("".isspace())
    print(" a".isspace())
    print("1 ".isspace())
    
  • isupper() 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False

    格式: isupper()

    print("ABC".isupper())
    print("ABC123".isupper())
    print("123ABC".isupper())
    print("A!@#B".isupper())
    print("abc".isupper())
    print("abC".isupper())
    print("abc123".isupper())
    print("Abc!@#".isupper())
    print("123".isupper())
    print("".isupper())
    print(" ".isupper())
    
  • islower() 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False

    格式: islower()

    print("abc".islower())
    print("abc123".islower())
    print("ABC".islower())
    print("abC".islower())
    print("Abc!@#".islower())
    print("123".islower())
    print("".islower())
    print(" ".islower())
    
  • istitle() 如果 string 是标题化的(所有单词首字符是大写)则返回 True,否则返回 False

    格式: istitle()

    print("Username".istitle())
    print("User Name".istitle())
    print("User_Name".istitle())
    print("User.Name".istitle())
    print("User+Name".istitle())
    print("username".istitle())
    print("UserName".istitle())
    print("user name".istitle())
    print("User name".istitle())
    

字符串转换类

  • capitalize() 把字符串的第一个字符大写

    格式: capitalize()

    print("username".capitalize())
    print("Username".capitalize())
    print("userNAME".capitalize())
    print("this is username".capitalize())
    
  • title() 返回标题化的 string,就是说所有单词都是以大写开始,其余字母均为小写

    格式: title()

    print("this is username".title())
    print("THIS IS USERNAME".title())
    print("tHIS IS username".title())
    
  • upper() 转换 string 中的小写字母为大写

    格式: upper()

    print("abc".upper())
    print("ABC".upper())
    print("abCd".upper())
    print("abc123".upper())
    print("abc123ABC".upper())
    
  • lower() 转换 string 中的小写字母为小写

    格式: lower()

    print("abc".lower())
    print("ABC".lower())
    print("abCd".lower())
    print("abc123".lower())
    print("abc123ABC".lower())
    

字符串对齐类

  • center() 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串,如果指定 fillchar 参数,则使用指定字符填充,fillchar 参数长度只能为 1

    格式: center(width, fillchar)

    print("|"+"sinocare".center(20) + "|")
    print("|"+"sinocare".center(5) + "|")
    print("|"+"sinocare".center(20, "-") + "|")
    
  • ljust() 返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串,如果指定 fillchar 参数,则使用指定字符填充,fillchar 参数长度只能为 1

    格式: ljust(width, fillchar)

    print("|"+"sinocare".ljust(20) + "|")
    print("|"+"sinocare".ljust(5) + "|")
    print("|"+"sinocare".ljust(20, "-") + "|")
    
  • rjust() 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串,如果指定 fillchar 参数,则使用指定字符填充,fillchar 参数长度只能为 1

    格式: rjust(width, fillchar)

    print("|"+"sinocare".rjust(20) + "|")
    print("|"+"sinocare".rjust(5) + "|")
    print("|"+"sinocare".rjust(20, "-") + "|")
    

字符串去除空白类

  • strip() 删除 string 左右两侧的空白字符, 如果指定 chars 参数,则删除左右两侧指定的字符

    格式: strip(chars)

    print("|" + "  sinocare " + "|")
    print("|" + "  sinocare  ".strip() + "|")
    print("|" + "  sinocare".strip() + "|")
    print("|" + "sinocare  ".strip() + "|")
    print("|" + " S i n c a r e s  ".strip() + "|")
    print("|" + "bachogwortsabc".strip("cba") + "|")
    
  • lstrip() 删除 string 左边的空白字符, 如果指定 chars 参数,则删除左两侧指定的字符

    格式: lstrip(chars)

    print("|" + "  sinocare  " + "|")
    print("|" + "  sinocare ".lstrip() + "|")
    print("|" + "  sinocare".lstrip() + "|")
    print("|" + "sinocare  ".lstrip() + "|")
    print("|" + "  s i n o c a r e  ".lstrip() + "|")
    print("|" + "bachogwortsabc".lstrip("cba") + "|")
    
  • rstrip() 删除 string 左边的空白字符, 如果指定 chars 参数,则删除右两侧指定的字符

    格式: rstrip(chars)

    print("|" + "  sinocare  " + "|")
    print("|" + "  sinocare ".rstrip() + "|")
    print("|" + "  sinocare".rstrip() + "|")
    print("|" + "sinocare  ".rstrip() + "|")
    print("|" + "  s i n o c a r e  ".rstrip() + "|")
    print("|" + "bachogwortsabc".rstrip("cba") + "|")
    

字符串分割类

  • split() 以 sep 为分隔符分割 string ,如果指定 maxsplit 参数,则仅分割 maxsplit 次

    格式: split(sep, maxsplit)

    print("a-b-c-d".split("-"))
    print("a-b-c-d".split("-", 2))
    print("a--b-c-d".split("-"))
    print("a-+b-c-d".split("-+"))
    print("a b\tc\nd\re".split())
    print("a b c d e".split(" ", 3))
    
  • splitlines() 使用换行符\n分割 string,如果指定 keepends 参数,则结果中会保留\n符号

    格式: splitlines(keepends)

    print("a\nb\nc".splitlines())
    print("a\nb\nc".splitlines(True))
    
  • partition() 从 sep 出现的第一个位置起,把 string 分成一个 3 元素的元组 (string_pre_sep,sep,string_post_sep), 如果 string 中不包含 sep 则 string_pre_str == string,其余元素为空字符串

    格式: partition(sep)

    print("This is sinocare".partition("is"))
    print("This is sinocare".partition("iss"))
    
  • rpartition() 从右向左 sep 出现的第一个位置起,把 string 分成一个 3 元素的元组 (string_pre_sep,sep,string_post_sep),如果 string 中不包含 sep 则 string_post_str == string,其余元素为空字符串

    格式: rpartition(sep)

    print("This is Hogworts".rpartition("is"))
    print("This is Hogworts".rpartition("iss"))
    

字符串连接类

  • +号 将两个字符串连接生成一个新字符串, + 号两侧必须都是字符串

    格式: str1 + str2

    print("Hello" + "World")
    print("Hello" + "123")
    print("Hello" + 123)
    
  • *号 将字符串重复 N 次后生成一个新字符串

    格式: str * n

    print("*"* 10)
    print("hello"* 10)
    
  • join() 使用 string 连接可迭代对象中的所有元素,可迭代对象参数中的所有元素必须是字符串

    格式: join(iterable)

    print("".join(("a","b","c")))
    print("-".join(("a","b","c")))
    print("->".join(("a","b","c")))
    print("->".join(["a","b","c"]))
    print("->".join({"a","b","c"}))
    print("->".join({"a":"A","b":"B","c":"C"}))
    

编码解码类

  • encode() 使用 encoding 指定的字符集,对 string 进行编码,转换成二进制字符串

    格式: encode(encoding)

    print("abc123".encode("gbk"))
    print("你好".encode("gbk"))
    
    print("abc123".encode("utf-8"))
    print("你好".encode("u8"))
    
  • decode() 使用 encoding 指定的字符集,对 string 进行解码,转换成字符串对象, string 必须是二进制字符串

    格式: decode(encoding)

    s1 = b'\xc4\xe3\xba\xc3'
    s2 = b'\xe4\xbd\xa0\xe5\xa5\xbd'
    print(s1.decode("gbk"))
    print(s2.decode("utf-8"))
    
    # print(s1.decode("u8"))
    # print(s2.decode("gbk"))
    

切片操作

对字符串按指定的范围进行截取,得到一个子字符串,指定范围时,起始下标必须小于结束下标,且子字符串不包含结束下标

格式: str[start: end: step]

s = "abcdefg"

# 普通切片
print(s[0: 2])
# 省略范围
print(s[0:])
print(s[: 2])
print(s[:])
# 指定步长
print(s[::1])
print(s[::2])
# 负下标
print(s[-3: -1])
# 负步长
print(s[-1: -3: -1])
# 逆序
print(s[::-1])

# 字符串的定义
def string_info():
    s1 = 'hello'
    print('hello')
    print(s1)
    print(type(s1))
    # 使用双引号定义字符串
    s2 = "你好 python!"
    print(s2)
    print(type(s2))
    # 使用三引号定义字符串
    s3 = 'select * from user where name="Tom"'
    s4 = """select * from user where name="Tom";"""
    s5 = '''select * from user where name='Tom'''''
    s6 = """select * from user where name='Tom';"""
    print(s3, s4, s5, s6)
    print(type(s3), type(s4), type(s5), type(s6))

    print("hello\nworld")  # 换行符
    s7 = '''select * from user where name='Tom\''''  # 转义字符
    print(s7)
    path1 = "c:\\python\\bin\\python.exe"
    path2 = "c:/python/bin/python.exe"
    print(path1, path2)

    s = "HelloWorld"
    # 字符串下标
    print(s[0])  # H
    print(s[5])  # W
    print(s[9])  # d

string_info()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值