python字符串切片赋值,003_python的str切片,str常用操作方法,for循环,集合,深浅copy

基础数据类型

基础数据类型,有7种类型,存在即合理。

1.int 整数

主要是做运算的 。比如加减乘除,幂,取余 + - * / ** %...

2.bool布尔值

判断真假以及作为条件变量

3.str 字符串

存储少量的数据。‘太白’,'password'... 操作简单,便于传输。

4.list 列表

[1,2,'alex',{name:'zhang'}]存放大量的数据,大量的数据放到列表中便于操作

5.tuple 元组

也叫只读列表。(1,2,'alex',{name:'zhang'}) 一些重要的数据或者不想被更改的数据,使用元组

6.dict 字典

{‘name_list’:'[zhang,lisi]'},存储关系型的数据,查询速度非常快,二分查找。

7.set 集合

交集,并集,差集...

分别举例

int整型

i = 4

#转化成二进制的最小位数

print(i.bit_length())

'''

1 0000 0001

1 0000 0010

3 0000 0011

4 0000 0100

'''

执行输出: 3

数据类型转换:int --> str:n = str(1)

执行输出: 1

int --> bool:n = bool(1)

执行输出: True

str --> bool:n = bool('')

执行输出: False

空字符串是False,其他都是True

str 字符串索引与切片

先讲索引

字符串是有序的,有索引的,索引从0开始,默认取值是从左至右

s = 'python是最好的语言'

#取第一个字符

s1 = s[0]

#取索引值为2的元素

s2 = s[2]

#最后一个

s3 = s[-1]

print(s1)

print(s2)

print(s3)

执行输出:

p

t

切片

语法:

[起始索引:截止索引:步长]

步长默认为1,表示从头开始取

切片,也就是取连续的多个值

切片原则,顾头不顾尾

什么意思?举例说明

s = 'python是最好的语言'

s1 = s[0:2]

print(s1)

执行输出:

py

全取

s = 'python是最好的语言'

s1 = s[:]

print(s1)

执行输出:

python是最好的语言

切片会产生新的变量,在内存中,原字符串和切片后的字符串,是2个变量s4 = s[:]虽然结果是一样的,但它是2个变量

对字符串操作,都会产生新的变量,除了赋值以外。

取最后5个字符串

s = 'python是最好的语言'

s1 = s[-5:]

print(s1)

执行输出:

最好的语言

步长

默认步长为1

隔一个取1个,步长为2

反向取值,也就是从后向前取,步长为-1

隔1个,取一个

s = 'python是最好的语言'

s1 = s[::2]

print(s1)

执行输出:

pto是好语

反向取5个

s = 'python是最好的语言'

s1 = s[:-5:-1]

print(s1)

执行输出:

言语的好

反向全取

s = 'python是最好的语言'

s1 = s[::-1]

print(s1)

执行输出:

言语的好最是nohtyp

字符串常用操作方法

capitalize() 首字母大写,其他字母小写

s = 'laoshi'

s1 = s.capitalize()

print(s1)

执行输出:

Laoshi

upper() 全部大写、lower() 全部小写

s = 'laoshi'

s1 = s.upper()

s2 = s.lower()

print(s1)

print(s2)

执行输出:

LAOSHI

laoshi

比如验证码判断功能

code = 'aeQu'

your_code = input('请输入验证码:')

if your_code == 'aequ' or your_code == 'Aequ'...

如果不使用字符串内置方法,这需要写16个if,代码质量非常low

下面使用字符串内置方法

code = 'aeQu'

your_code = input('请输入验证码:')

if your_code.upper() == code.upper():

print('验证码验证成功')

执行输出:

3e75c783015b

验证成功

代码优化一下

code = 'aeQu'.upper()

your_code = input('请输入验证码:').upper()

if your_code == code:

print('验证码验证成功')

center() 居中

s = 'laoshi'

#总宽度为30,并且字符串居中,不足30,默认用空格填充

s1 = s.center(30)

#使用*填充

s2 = s.center(30,'*')

print(s1)

print(s2)

执行输出:

3e75c783015b

执行输出

如果宽度小于字符串,按照原来的字符串显示

s = 'laoshi'

s1 = s.center(3)

print(s1)

执行输出:

laoshi

swapcase() 大小写反转

s = 'LaoShi'

s1 = s.swapcase()

print(s1)

执行输出:

lAOsHI

title() 每个单词的首字母大写(非字母隔开)

s = 'xiao wusir*nanhai21shui'

s1 = s.title()

print(s1)

执行输出:Xiao Wusir*Nanhai21Shui

startswith() 判断以什么为开头,endswith() 以什么为结尾

startswith 的start和end参数是切片如果想取到最后,end参数,不需要指定。

s = 'xiao wusir*nanhai21shui'

s1 = s.startswith('a')

s2 = s.endswith('i')

#切片,取索引访问1~4,再判断是否以i开头

s3 = s.startswith('i',1,4)

#切片,取索引范围5~结束,结束位置参数没给,默认一直取到尾

s4 = s.startswith('w',5)

print(s1)

print(s2)

print(s3)

print(s4)

执行输出:

False

True

True

True

strip() 去除首尾的空格,换行符(\n),tab键(4个空格 用\t表示)

s = '\nlaoshi\t '

s1 = s.strip()

print(s1)

执行输出: laoshi

在input程序中,会经常使用

name = input('请输入用户名:')

if name == 'xiao':

print('ok')

如果用户输入的,不小心包含了空格,会导致验证失败

下面加入strip()

即使输入有空格,也可以验证通过

name = input('请输入用户名:').strip()

if name == 'xiao':

print('ok')

执行输出:

3e75c783015b

输入用户名

后续操作文件读取一行内容的时候,也会带有换行符,虽然你看不见,使用strip(),就可以去除了类似功能的2个的方法

lstrip() 去除左边的空格、换行符、tab键

rstrip() 去除右边的空格、换行符、tab键

strip()还可以去除指定的字符串

s = 'laoshijintianzalill'

#去除字符串l

s1 = s.strip('l')

print(s1)

执行输出:aoshijintianzali

解释一下执行过程 ☻→ string ← ☻

strip()相当于 ☻,就像吃豆游戏一样。

strip()会同时向左右2边,挨个挨个字符寻找字符串l 如果发现了l,就去除,如果没有发现,终止寻找,最后输入结果比如头部的lao 找到了字符串l,开始删除。再继续找下一个字符a,发现不匹配,终止寻找同时,尾部的lill,找到l,开始删除。继续找下一个,找到l,删除。再继续下一个,发现字符串i,不匹配,终止寻找最终输出: aoshijintianzali

find()通过元素找索引

还有一个函数index(),也是同样的功能不同的是,index()找不到,直接报错find()找不到时,会返回-1

s = 'xiaoxx'

s1 = s.find('a')

s2 = s.index('a')

print(s1)

print(s2)

执行输出: 2

count()寻找元素出现的个数,可切片

s = 'xiaomingtongxue'

s1 = s.count('x')

#从第5个索引一直到最后,寻找字符串o出现的次数

s2 = s.count('o',5)

print(s1)

print(s2)

执行输出:

2

1

replace() 替换

s = '我的老家在东北,东北有很多人'

#默认是全文替换

s1 = s.replace('东北','黑龙江')

#替换一次

s2 = s.replace('东北','黑龙江',1)

print(s1)

print(s2)

执行输出:

我的老家在黑龙江,黑龙江有很多人

我的老家在黑龙江,东北有很多人

替换,是从左至右的

如果想要替换中间某部分,需要用到正则表达式

split() 分割,将字符串转换为列表,默认按照空格分隔:

s = 'wo zai tai bei'

s1 = s.split()

print(s1)

执行输出:['wo', 'zai', 'tai', 'bei']

指定分割符

s = 'wo,zai,tai,bei'

s1 = s.split()

print(s1)

执行输出,效果同上

指定字符串a

s = 'awozaiataiabei'

s1 = s.split('a')

print(s1)

执行输出:

['', 'woz', 'i', 't', 'i', 'bei']

注意:如果关键字左边没有字符串,那么结果为[],也就是空字符串

结果不包含关键字,被剔除了

比如面试题:

有下面一段日志,包含了IP地址和时间...需要切割日志

216.244.66.227,[20/Mar/2018:17:03:52 +0800],"Mozilla/5.0"

114.215.45.101,[20/Mar/2018:17:16:30 +0800],"BUbiNG"

106.11.152.107,[20/Mar/2018:17:22:40

+0800],"YisouSpider"

可以用正则表达式,但是比较麻烦,有没有更简单的办法呢?用split(),指定逗号分割,就可以实现

format() 格式化输出这个很牛逼,一定要重点掌握!有三种用法:

第一种用法:

s = '我叫{},今年{},爱好{}'.format('MT',18,'打怪')

print(s)

执行输出:

我叫MT,今年18,爱好打怪

{}表示一个占位符

isalnum() 字符串由字母或数字组成

isalpha() 字符串只能由字母组成

isdigit()字符串只能由数字组成

name = 'jingsan123'

s1 = name.isalnum()

s2 = name.isalpha()

s3 = name.isdigit()

print(s1)

print(s2)

print(s3)

执行输出:

True

False

False

isdigit()比较常用,比如判断用户输入的,是否是数字。

或者将字符串转换为数字类型时,要判断字符串是否由纯数字组成,否则报错。

name = '123a'

if name.isdigit():

name = int(name)

else:

print('您输入的含有非数字元素')

执行输出:

您输入的含有非数字元素

len() 查看数据的长度

name = 'zhangsan'

print(len(name))

执行输出: 8

for循环

先来使用while循环,打印每一个字符串

s = 'abcdef'

count = 0

while count < len(s):

print(s[count])

count += 1

执行输出:

a

b

c

d

e

f

使用for循环完成上面的功能

s = 'abcdef'

for i in s:

print(i)

执行程序,效果同上

for循环和while循环的区别在于

for 循环是有限循环

while 循环是无限循环

有些情况,在不需要终止条件的情况下,使用for循环

有终止条件的,使用while循环

for循环会自动停止 使用for循环实现九九乘法表:

for i in range(1, 10):

for j in range(1, i + 1):

print('{}x{}={}\t'.format(j, i, i * j), end='')

print('\n')

执行输出:

1x1=1

1x2=2 2x2=4

1x3=3 2x3=6 3x3=9

1x4=4 2x4=8 3x4=12 4x4=16

1x5=5 2x5=10 3x5=15 4x5=20 5x5=25

1x6=6 2x6=12 3x6=18 4x6=24 5x6=30 6x6=36

1x7=7 2x7=14 3x7=21 4x7=28 5x7=35 6x7=42 7x7=49

1x8=8 2x8=16 3x8=24 4x8=32 5x8=40 6x8=48 7x8=56 8x8=64

1x9=9 2x9=18 3x9=27 4x9=36 5x9=45 6x9=54 7x9=63 8x9=72 9x9=81

作业

有变量name = "aleX leNb" 完成如下操作:

移除name变量对应的值两边的空格,并输出处理结果

移除name变量左边的'al'并输出处理结果

移除name变量右面的'Nb',并输出处理结果

移除name变量开头的a'与最后的'b',并输出处理结果

name = "aleX leNb"

s1 = name.strip()

s2 = name.lstrip('al')

s3 = name.rstrip('Nb')

s4 = name.lstrip('a').rstrip('b')

print(s1)

print(s2)

print(s3)

print(s4)

判断 name 变量是否以 "al" 开头,并输出结果

判断name变量是否以"Nb"结尾,并输出结果

s5 = name.startswith('al')

s6 = name.endswith('Nb')

print(s5)

print(s6)

将name变量对应的值中的 所有的"l" 替换为 "p",并输出结果

将name变量对应的值中的第一个'l'替换成'p',并输出结果

s7 = name.replace('l','p')

s8 = name.replace('1','p',1)

print(s7)

print(s8)

将 name 变量对应的值根据 所有的"l" 分割,并输出结果。

将name变量对应的值根据第一个'l'分割,并输出结果。

s9 = name.split('l')

s10 = name.split('l',1)

print(s9)

print(s10)

将 name 变量对应的值变大写,并输出结果

将 name 变量对应的值变小写,并输出结果

s11 = name.upper()

s12 = name.lower()

print(s11)

print(s12)

将name变量对应的值首字母'a'大写,并输出结果

判断name变量对应的值字母'l'出现几次,并输出结果

如果判断name变量对应的值前四位'l'出现几次,并输出结果

s13 = name.capitalize()

s14 = name.count('l')

s15 = name.count('l',4)

print(s13)

print(s14)

print(s15)

从name变量对应的值中找到'N'对应的索引(如果找不到则报错),并输出结果

从name变量对应的值中找到'N'对应的索引(如果找不到则返回-1)输出结果

从name变量对应的值中找到'X le'对应的索引,并输出结果

s16 = name.index('N')

s17 = name.find('N')

s18 = name.find('X le')

print(s16)

print(s17)

print(s18)

请输出 name 变量对应的值的第 2 个字符?

请输出 name 变量对应的值的前 3 个字符?

请输出 name 变量对应的值的后 2 个字符?

请输出 name 变量对应的值中 "e" 所在索引位置?

s19 = name[2]

s20 = name[:3]

s21 = name[-2:]

s22 = name.find('e')

s23 = name[:-1:]

print(s19)

print(s20)

print(s21)

print(s22)

23)获取子序列,去掉最后一个字符。如: oldboy 则获取 oldbo。

name = "oldboay"

#使用split对最后一个字符分割,并取第一个元素

s3 = name.split(name[-1])[0]

print(s3)

有字符串s = '123a4b5c'

1)通过对li列表的切片形成新的字符串s1,s1 = '123'

2)通过对li列表的切片形成新的字符串s2,s2 = 'a4b'

3)通过对li列表的切片形成新的字符串s3,s3 = '1345'

4)通过对li列表的切片形成字符串s4,s4 = '2ab'

5)通过对li列表的切片形成字符串s5,s5 = 'c'

6)通过对li列表的切片形成字符串s6,s6 = 'ba2'

s = '123a4b5c'

s1 = s[0:3]

s2 = s[3:6]

s3 = s[0]+s[2]+s[4]+s[6]

s4 = s[1]+s[3]+s[5]

s5 = s[-1]

s6 = s[5]+s[3]+s[1]

print(s1)

print(s2)

print(s3)

print(s4)

print(s5)

print(s6)

使用while和for循环分别打印字符串s='asdfer'中每个元素。

s = 'asdfer'

count = 0

while count < len(s):

print(s[count])

count += 1

实现一个整数加法计算器(两个数相加):

如:content = input('请输入内容:') # 如用户输入:5+9或5+ 9或5 + 9,然后进行分割再进行计算。

content = input('请输入内容:')

num = content.split('+')

sum = 0

for i in num:

sum += int(i)

print(sum)

计算用户输入的内容中有几个整数(以个位数为单位)。

如:content = input('请输入内容:') # 如fhdal234slfh98769fjdla

count = 0

content = input('请输入内容:')

for i in content:

if i.isdigit():

count += 1

print(count)

集合

集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的。以下是集合最重要的两点:

去重,把一个列表变成集合,就自动去重了。

关系测试,测试两组数据之前的交集、差集、并集等关系。

1.集合的创建

set1 = set({1,2,'barry'})

set2 = {1,2,'barry'}

print(set1,set2)

执行输出

{1, 2, 'barry'} {1, 2, 'barry'}

2.集合的增

set1 = {'alex','wusir','ritian','egon','barry'}

set1.add('景女神')

print(set1)

#update:迭代着增加

set1.update('A')

print(set1)

set1.update('老师')

print(set1)

set1.update([1,2,3])

print(set1)

执行输出:

{'wusir', 'egon', 'alex', 'ritian', 'barry', '景女神'}

{'wusir', 'A', 'egon', 'alex', 'ritian', 'barry', '景女神'}

{'老', 'wusir', 'A', 'egon', 'alex', 'ritian', 'barry', '师', '景女神'}

{'老', 'wusir', 1, 2, 3, 'A', 'egon', 'alex', 'ritian', 'barry', '师', '景女神'}

3.集合的删

set1 = {'alex','wusir','ritian','egon','barry'}

set1.remove('alex') # 删除一个元素

print(set1)

set1.pop() # 随机删除一个元素

print(set1)

set1.clear() # 清空集合

print(set1)

del set1 # 删除集合

执行输出

{'ritian', 'wusir', 'egon', 'barry'}

{'wusir', 'egon', 'barry'}

set()

4.集合的其他操作:

交集。(& 或者 intersection)

set1 = {1,2,3,4,5}

set2 = {4,5,6,7,8}

print(set1 & set2)

print(set1.intersection(set2))

执行输出:

{4, 5}

{4, 5}

并集。(| 或者 union)

set1 = {1,2,3,4,5}

set2 = {4,5,6,7,8}

print(set1 | set2)

print(set2.union(set1))

执行输出

{1, 2, 3, 4, 5, 6, 7, 8}

{1, 2, 3, 4, 5, 6, 7, 8}

差集。(- 或者 difference)

set1 = {1,2,3,4,5}

set2 = {4,5,6,7,8}

print(set1 - set2)

print(set1.difference(set2))

执行输出

{1, 2, 3}

{1, 2, 3}

反交集。 (^ 或者 symmetric_difference)

set1 = {1,2,3,4,5}

set2 = {4,5,6,7,8}

print(set1 ^ set2)

print(set1.symmetric_difference(set2))

执行输出

{1, 2, 3, 6, 7, 8}

{1, 2, 3, 6, 7, 8}

子集与超集

set1 = {1,2,3}

set2 = {1,2,3,4,5,6}

print(set1 < set2)

print(set1.issubset(set2)) # 这两个相同,都是说明set1是set2子集。

print(set2 > set1)

print(set2.issuperset(set1)) # 这两个相同,都是说明set2是set1超集。

frozenset不可变集合,让集合变成不可变类型。

s = frozenset('barry')

print(s,type(s))

执行输出

frozenset({'b', 'a', 'r', 'y'})

深浅copy

1.先看赋值运算

l1 = [1,2,3,['barry','alex']]

l2 = l1

l1[0] = 111

print(l1)

print(l2)

l1[3][0] = 'wusir'

print(l1)

print(l2)

执行输出:

[111, 2, 3, ['barry', 'alex']]

[111, 2, 3, ['barry', 'alex']]

[111, 2, 3, ['wusir', 'alex']]

[111, 2, 3, ['wusir', 'alex']]

对于赋值运算来说,l1与l2指向的是同一个内存地址,所以他们是完全一样的。

2.浅拷贝copy

l1 = [1,2,3,['barry','alex']]

l2 = l1.copy()

print(l1,id(l1))

print(l2,id(l2))

l1[1] = 222

print(l1,id(l1))

print(l2,id(l2))

l1[3][0] = 'wusir'

print(l1,id(l1[3]))

print(l2,id(l2[3]))

执行输出

[1, 2, 3, ['barry', 'alex']] 2200143751176

[1, 2, 3, ['barry', 'alex']] 2200143750920

[1, 222, 3, ['barry', 'alex']] 2200143751176

[1, 2, 3, ['barry', 'alex']] 2200143750920

[1, 222, 3, ['wusir', 'alex']] 2200143749768

[1, 2, 3, ['wusir', 'alex']] 2200143749768

对于浅copy来说,第一层创建的是新的内存地址,而从第二层开始,指向的都是同一个内存地址,所以,对于第二层以及更深的层数来说,保持一致性。

3.深拷贝deepcopy

import copy

l1 = [1,2,3,['barry','alex']]

l2 = copy.deepcopy(l1)

print(l1,id(l1))

print(l2,id(l2))

l1[1] = 222

print(l1,id(l1))

print(l2,id(l2))

l1[3][0] = 'wusir'

print(l1,id(l1[3]))

print(l2,id(l2[3]))

执行输出

[1, 2, 3, ['barry', 'alex']] 1722671719688

[1, 2, 3, ['barry', 'alex']] 1722671719816

[1, 222, 3, ['barry', 'alex']] 1722671719688

[1, 2, 3, ['barry', 'alex']] 1722671719816

[1, 222, 3, ['wusir', 'alex']] 1722671720456

[1, 2, 3, ['barry', 'alex']] 1722671720200

对于深copy来说,两个是完全独立的,改变任意一个的任何元素(无论多少层),另一个绝对不改变。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值