Python 字符串(3.11)

1.字符串(定义),转义字符,编码相关

1.什么是字符串(str)

字符是容器型数据类型;将’‘、“”、“”“”“”、’‘’‘’'作为容器的标志,里面的每个符号就是字符串的元素
不可变;有序
元素:字符串的元素就是引号中的每一个基本符号。元素又叫字符,字符又分为普通字符和转义字符两种。

2.转义字符

转义字符就是在特定的符号前加\让符号具备特殊的功能或者意义。
\n - 换行,相当于return键
\t - 水平制表符,相当于tab键
’ - 表示一个单引号
" - 表示一个双引号
\ - 表示一个反斜杠
注意:转义字符的长度是1
print('hj8;\n123')
poem = '\t床前明月光,\n\t疑是地上霜。\n\t举头望明月,\n\t低头思故乡。'
print(poem)

# message = 'it's me!'    # SyntaxError: invalid syntax
# message = "it's me!"      # 方案一
message = 'it\'s me!'       # 方案二
print(message)

# message = "I say:"how are you?""    # SyntaxError: invalid syntax
# message = 'I say:"how are you?"'
message = "I say:\"how are you?\""
print(message)

message = 'abc\\n123'
print(message)

file = 'C:\\name\\study\\aa.txt'
print(file)

3.转义字符-编码字符

\u四位的十六进制数 - 表示四位的十六进制数编码值对应的字符
message = 'abc\u4f78=\\u=='
print(message)   # abc佸===

4.字符编码

1)字符编码

计算机在存储数据的时候只能存数字(存数字的二进制补码),文本符号是不能直接保存在内存中的,为了能够让计算机存储文本符号,
就给每个符号对应一个固定的数字,在保存符号的时候就去保存这个符号对应的数字。每个符号对应的数字就是这个符号的编码值。

2)编码表 - 记录每个符号对应的编码值的表
a.ASCII码表:
        数字字符在字母的前面,编码值从字符0到字符9依次增加;
        所有大写字母在所有的小写字母前面;
        大写字母和小写字母之间有间隙;
b.Unicode编码表:
        Unicode是ASCII码表的扩展,包含了ASCII码表中所有的符号;
        包含了所有国家所有民族的所有语言的符号(万国码);
        中文范围:4e00 ~ 9fa5
print('\u4eff')
# 1)编码字符: \u4位的16进制编码值
print('a\u0061')
c = '类'
print('\u4e00' <= c <= '\u9fa5')

print('\u28ef\u283f')

3)编码相关的函数
a. chr(编码值) - 获取指定编码对应的字符,返回的数据的类型是字符串
print(chr(97))      # a
print(chr(0x4e00))  # 一
print(chr(0x4e01))  # 丁
for x in range(0x4e00, 0x9fa5+1):
    print(chr(x), end=' ')
    if x % 30 == 0:
        print()
print('===========================')
for x in range(0x1800, 0x18AF+1):
    print(chr(x), end=' ')
print()

for x in range(0x4dc0, 0x4dff+1):
    print(chr(x), end=' ')
print()
b. ord(字符) - 获取字符编码值(字符用长度是1的字符串表示)
print(hex(ord('余')))     # 20313   0x4f59
print(hex(ord('婷')))     # 23159   0x5a77

##练习: 写一个程序将输入的小写字母字符转换成对应的大写字母

str4=input('请输入字母:')
list5=[chr(ord(x)-32) if 97<=ord(x)<=122 else x for x in str4]
result=''.join(list5)
print(result)

2.字符串相关操作

1.查 - 获取字符

字符串获取字符的方法和列表获取元素的方法一样
str1 = 'python'
print(str1[1])   # 'y'
print(str1[-1])     # 'n'
# print(str1[7])      # IndexError: string index out of range

str2 = 'abc\n123'
print(str2[4])      # 1

print(str1[2:])     # 'thon'
print(str1[1:-1:2])     # 'yh'
print(str1[::-1])       # 'nohtyp'

for x in str1:
    print('x:', x)

for index in range(len(str1)):
    print(index, str1[index])

2.相关操作

1) +、*
str2 = 'abc'
str3 = 'xyz'
str4 = str2 + str3    # 'abcxyz'
print(str4)     # 'abcxyz'

str5 = str2 + '=' + str3
print(str5)     # 'abc=xyz'

print(str2 * 3)   # 'abcabcabc'
2)
==、!=
print('abc' == 'abc')    # True
print('abc' == 'bac')    # False
>、<、>=、<=
两个字符串比较大小比较的是第一对不相等的字符的编码值的大小
判断字符是否是小写字母:‘a’ <= char <= ‘z’
判断字符是否是大写字母:‘A’ <= char <= ‘Z’
判断字符是否是字母:‘a’ <= char <= ‘z’ or ‘A’ <= char <= ‘Z’
判断是否是数字字符:‘0’ <= char <= ‘9’
判断是否是中文字符:‘\u4e00’ <= char <= ‘\u9fa5’

练习:统计字符串中数字字符的个数

str0 = 'jsj28海事局389sjj--3sskk9jj'
count = 0
for x in str0:
    if '0' <= x <= '9':
        count += 1
print('数字的个数:', count)

练习:提取字符中所有的中文字符

‘aj好23l-数据–2啊’ -> ‘好数据啊’

法一:

str1='aj好23l-数据--2啊'
newstr=''
for x in str1:
	if '\u4e00'<=x<='9fa5':
		newstr+=x
print(newstr)

法二:

str1='aj好23l-数据--2啊'
list1=[x for x in str1 if '\u4e00'<=x<='\u9fa5']
result=''.join(list1)
print(result)
3) in 和 not in
字符 in 字符串 - 判断字符串中是否存在指定的字符
字符串1 in 字符串2 - 判断字符2中是否存在字符串1(判断字符串1是否是字符串2的子串)
print('a' in 'abc')    # True
print('ab' in 'abc')    # True
print('ac' in 'abc')    # False
4)
a. max、min、sorted
b. str
c.len(字符串) - 获取字符串中字符的个数
str(数据) - 将指定数据转换成字符串(所有类型的数据都可以转换成字符串;转换的时候直接在数据的打印值外面加引号)
str(100)     # '100'
str([100, 200])    #  '[100, 200]'
str({'a': 10, 'b': 20})    # "{'a': 10, 'b': 20}"

print(len('\tabc\n123'))   # 8
print(len('\\tabc\n123'))  # 9
3.r语法
字符串的最前面加r/R,能够让字符串中所有转义字符的功能消失,字符串中的每个符号都是普通字符
str1 = r'\tabc\n12\\3\''
print(str1)     # \tabc\n12\\3\'

path = R'C:\uers\yuting\name\test\aa.txt'
print(path)

3.字符串重要方法

1. 字符串1.count(字符串2) - 返回字符串1中字符串2出现的次数
str1 = 'how are you? i am fine, thank you!'
print(str1.count('h'))    # 2
print(str1.count(' '))    # 7
print(str1.count('you'))  # 2
2.字符串.join(序列) - 将序列中的元素用指定的字符串拼接产生一个新的字符串。(序列中的元素必须是字符串)
result = '+'.join('abc')
print(result)    # a+b+c

result = 'And'.join('hello')
print(result)   # hAndeAndlAndlAndo

result = '+'.join(['name', 'age', 'gender'])
print(result)   #  name+age+gender

result = ''.join(['name', 'age', 'gender'])
print(result)   # nameagegender

result = '*'.join({'a': 10, 'b': 20, 'c': 30})
print(result)   # a*b*c

练习:

nums = [10, 20, 30, 25, 6] -> ‘102030256’

方法一:
nums = [10, 20, 30, 25, 6]

# 方法一:
result = ''
for x in nums:
    result += str(x)
print(result)    # 102030256
方法二:
result = ''.join([str(x) for x in nums])
print(result)    # 102030256

list1 = [23, 'name', 309.9, 'age', True, 'abc']    # 'name+age+abc'
result = '+'.join([x for x in list1 if type(x) == str])
print(result)   # name+age+abc
3.
字符串1.split(字符串2) - 将字符串1中所有字符串2作为切割点对字符串1进行切割,返回的是列表
字符串1.split(字符串2, N) - 将字符串1中前N个字符串2作为切割点,对字符串1进行切割
str1 = 'abc+123+xyz+mn'
result = str1.split('+')
print(result)    # ['abc', '123', 'xyz', 'mn']

str2 = 'hejs123斯柯达123000'
result = str2.split('123')
print(result)   # ['hejs', '斯柯达', '000']

# 如果切割点连续或者切割点在边界,切割完成后会产生空串
str3 = '+abc+123++xyz+mn+'
result = str3.split('+')
print(result)   # ['', 'abc', '123', '', 'xyz', 'mn', '']

str1 = 'abc+123+xyz+mn'
result = str1.split('+', 1)
print(result)   # ['abc', '123+xyz+mn']

4.
字符串1.replace(字符串2, 字符串3) - 将字符串1中所有的字符串2全部替换成字符串3
字符串1.replace(字符串2, 字符串3, N)
str1 = 'abc+123+xyz+mn'
result = str1.replace('+', '-')
print(result)   # abc-123-xyz-mn

3.进制(二/八/十/十六进制)

计算机对于数字的使用主要4种进制:二进制、八进制、十进制和十六进制

1.十进制

基数:0 ~ 9
进位:逢10进1
位权:10的次方数(从0开始) 123 -> 310**0 + 2101 + 1*102 == 123
Python表示:直接写
print(10)
print(123)

2.二进制

基数:0 ~ 1
进位:逢2进1
位权:2的次方数 100 -> 02**0 + 021 + 1*22 == 4
1011 -> 20 + 21 + 2**3 == 11
Python表示:加前缀0b/0B
print(0b1011)    # 11
# print(0b1211101)   # 报错

3.八进制

基数:0 ~ 7
进位:逢8进1
位权:8的次方数 23 -> 38**0 + 28**1 == 19
Python表示:加前缀0o / 0O
print(0o23)

4.16进制

基数:09,af(A~F)
进位:逢16进1
位权:16的次方数
Python表示:0x/0X af -> 1516**0 + 1016**1 == 175
hex(数字)
print(0xaf)   # 175
print(0b1100100)    # 100
print(0o144)        # 100
print(0x64)         # 100

print(hex(97))

作业

  1. 输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)

例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**

def index_odd():
    str1=input('请输入字符串:')
    new_str=''
    for _ in range(len(str1)):
        if _%2:
            new_str+=str1[_]
    print(new_str)
index_odd()

方法二:(推导式)

def index_odd2():
    str1=input('请输入字符串:')
    new_list=[str1[_] for _ in range(len(str1)) if _%2]
    result=''.join(new_list)
    print(result)
index_odd2()

方法三:

str1=input('请输入字符串:')
print(str1[1::2])

结果:
在这里插入图片描述

  1. 输入用户名,判断用户名是否合法(用户名长度6~10位)
def judge_name():
    str1 = input('请输入用户名:')
    if 6<=len(str1)<=10:
        print('合法!')
    else:
        print('不合法!')
judge_name()

结果:
在这里插入图片描述

  1. 输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)

    例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法

def judge_name2():
    name = input('请输入用户名:')
    for x in name:
        if not('0'<=x<='9' or 'a'<=x<='z' or 'A'<=x<='Z'):
            print('不合法!')
            break
    else:
        print('合法!')
judge_name2()

结果:
在这里插入图片描述
在这里插入图片描述

  1. 输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)

    例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法

def judge_name3():
    name = input('请输入用户名:')
    # 判断首字符是否符合条件,记录bool值
    capital=bool('A'<=name[0]<='Z')
    #首字符不合法
    if capital==False:
        print('不合法,首字母需要大写!')
    #如果首字符合法,进行后续判断
    while capital:
        for x in name:
            if '0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z':
                pass
            else:
                print('不合法!只能含有数字或者字母!')
                return #这里如果写break ,跳不出while循环  ......?
        else:
            print('合法!')
            return
judge_name3()

方法二:(考虑同时要有字母和数字)

def judge_name33():
    name = input('请输入用户名:')
    if 'A'<=name[0]<='Z':
        count=0
        for x in name:
            if '0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z':
                if '0' <= x <= '9':
                    count+=1
            else:
                print('不合法,不只含有数字,字母!')
        else:
            if count>0:
                print('合法!')
            else:
                print('不合法!')
    else:
        print('不合法,首字符需要大写!')

judge_name33()

结果:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  1. 输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串

    例如:输入**‘abc1shj23kls99+2kkk’** 输出:‘123992’
    方法一:

str1=input('请输入字符串:')
new_str=''
for x in str1:
    if '0'<=x<='9':
        new_str+=x
print('新字符串为:{}'.format(new_str))

方法二:(推导式+join())

str1=input('请输入字符串:')
new_list=[x for x in str1 if '0'<=x<='9']
result=''.join(new_list)
print(result)

在这里插入图片描述

结果:

  1. 输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)

    例如: 输入**‘a2h2klm12+’ ** 输出 ‘A2H2KLM12+’
    方法一:upper()

str1=input('请输入字符串:')
print(str1.upper())

方法二:

str1=input('请输入字符串:')
str_len=len(str1)
new_str=''
for x in str1:
    if 'a'<=x<='z':
        new_str+=chr(ord(x)-32)
    else:
        new_str+=x
print(new_str)

方法三:(推导式(三目运算符))

str1=input('请输入字符串:')
new_list=[chr(ord(x)-32) if 'a'<=x<='z' else x for x in str1]
result=''.join(new_list)
print(result)

结果:
在这里插入图片描述

  1. 输入一个小于1000的数字,产生对应的学号

    例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**

def stu_nums():
    numstr=input('请输入0~999的数字,生成学号:')
    num_len=len(numstr)
    if num_len==1:
        print('py190100'+numstr)
    elif num_len==2:
        print('py19010'+numstr)
    elif num_len==3:
        print('py1901' + numstr)
    else:
        print('输入不合法!')
stu_nums()

方法二:

numstr=input('请输入0~999的数字,生成学号:')
result='py1901'+'0'*(3-len(numstr))+numstr
print(result)

方法三:
字符串.zfill(N) - 将原字符串转换成长度为N的新字符串,不够的在原字符串前加‘0’

num=input('请输入0~999的数字,生成学号:')
new_str='py1901'+num.zfill(3)
print(new_str)

结果:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

  1. 输入一个字符串,统计字符串中非数字字母的字符的个数

    例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**‘===’** 输出:3
    方法一:

str1=input('请输入字符串:')
count=0
for x in str1:
    if not('0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z'):
        count+=1
print('非数字字母的字符的个数为:',count)

方法二:

str1=input('请输入字符串:')
newlist=[x for x in str1 if not('0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z')]
print('非数字字母的字符的个数为:',len(newlist))

结果:
在这里插入图片描述

  1. 输入字符串,将字符串的开头和结尾变成’+',产生一个新的字符串

    例如: 输入字符串**‘abc123’, 输出’+bc12+'**

str1=input('请输入字符串:')
print('+'+str1[1:-1]+'+')

结果:
在这里插入图片描述

  1. 输入字符串,获取字符串的中间字符

例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**

str1=input('请输入字符串:')
str_len=len(str1)
if str_len%2:
    print(str1[str_len//2])
else:
    print(str1[(str_len//2)-1:str_len//2+1])

结果:
在这里插入图片描述

  1. 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8

str1=input('请输入字符串1:')
str2=input('请输入字符串2:')
str_len1=len(str1)
str_len2=len(str2)
for i in range(str_len1-str_len2+1):
    if str2==str1[i:i+str_len2]:
        print(i)
        break
# 找不到的情况
else:
    print('没有该子串',-1)

结果:
在这里插入图片描述

  1. 获取两个字符串中公共的字符

例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

str1=input('请输入字符串1:')
str2=input('请输入字符串2:')
str_len1=len(str1)
str_len2=len(str2)
if str_len1>=str_len2:
    new_list = [x for x in str2 if x in str1]
else:
    new_list = [x for x in str1 if x in str2]
result=''.join(new_list)
print('公共字符有:',result)

方法二:(集合)

str1=input('请输入字符串1:')
str2=input('请输入字符串2:')
set1=set(str1)
set2=set(str2)
set3=set1&set2
result=''.join(set3)
print('公共字符有:',result)

方法三:

str1=input('请输入字符串1:')
str2=input('请输入字符串2:')
new_str=''
str_len1=len(str1)
str_len2=len(str2)
if str_len1>=str_len2:
    for x in str2:
        if x in str1 and x not in new_str:
            new_str+=x
else:
    for x in str1:
        if x in str2 and x not in new_str:
            new_str += x
print('公共字符有:',new_str)

结果:
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值