python——strip与split的区别

本文深入探讨Python中strip()和split()函数的使用方法,包括去除字符串两端特定字符、拆分字符串为列表,以及在网页爬取和数据清洗中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

有时候总是分不清split跟strip,也有人问我去掉空格到底是用strip啊还是split啊,现在就来探讨一下什么时候用strip,什么时候用split

strip()函数

用法:(1)用于移除字符串头尾指定的字符(默认为空格)。
就比如这个例子,strip()就默认将string2里面的字符串的空格去掉,输出结果为:abc

string2 = '  abc'
print(string2.strip())

(2)strip()还可以去掉指定的字符,在strip(‘要去掉的字符’)在括号里输入要去掉的字符,但是strip只能删除前后指定的字符,遇到空格就会不理

string = 'hello thank you are you ok hello'
result = string.strip('helo')
print(result)

输出结果为: thank you are you ok

(3)比如说有时候爬取网页的时候会碰到一对的\n,\t什么的,也可以用strip把它们去掉

string = 'fhau\nweifh\nfhow\niaehf\tfweioaufh\n'
result = string.strip('\n\t')
print(result)

输出结果为:
fhau
weifh
fhow
iaehf fweioaufh

split()函数

split()一般用于拆分字符串。通过指定分隔符对字符串进行切片,并返回分割后的字符串弄成列表,也就是list,list应该知道吧?比如这种[‘a’,‘b’,‘c’]就是列表

(1)下面这个例子是以**.**来切割字符串,简单来说就是把小点两边的分离

string3 = 'www.baidu.com'
result = string3.split('.')
print(result)

输出结果为:[‘www’, ‘baidu’, ‘com’]

(2)分离个数,可以在split(’.’,个数),个输入为(int)整数

string3 = 'www.baidu.com'
result = string3.split('.',1)
print(result)

输出结果为:[‘www’, ‘baidu.com’],很多人会好奇为什么不是输出一个元素,而是输出两个元素,其实这里的1是从零开始数的,跟数组差不多,所以打印的结果是两个元素

(3)取列表元素的序列

string3 = 'www.baidu.com'
result = string3.split('.',1)[0]
print(result)

输出结果为:www,这个应该不难理解,[0]就是取第一个元素,[1]就是取第二个元素

(4)分开打印,这里可以将两个值分别赋给两个变量,是不是觉得python的优点了呢?

string3 = 'www.baidu.com'
result,re = string3.split('.',1)
print(result+"\n",re)

输出结果为:
www
baidu.com

(5)相信喜欢爬虫的朋友们都遇到过爬取网页是爬到很多无关的符号啊,标签吧,用split可以轻松解决,个人觉得正则表达式效果更好

string3 = '<html><body>[Hello World]</body></html>'
result = string3.split("[")[1].split("]")[0]
print(result)

输出结果为:Hello World

正在尝试写博客,把会的分享给你们,如有写的不好的地方,希望指点一下,喜欢的朋友们请点个赞,谢谢!

### Python 字符串处理方法和函数 #### 字符串定义 字符串是 Python 中最常用的数据类型之一,它们可以用单引号或双引号来表示[^1]。 ```python single_quoted_string = 'Hello, world!' double_quoted_string = "Hello, universe!" ``` #### 基本字符串操作函数 ##### 拼接字符串 可以通过加号 `+` 来实现两个字符串的拼接: ```python greeting = "Hello" name = "Alice" message = greeting + ", " + name # 输出: Hello, Alice ``` ##### 分割字符串 使用 `split()` 函数可以根据指定分隔符将字符串分割成列表: ```python text = "apple,banana,cherry" fruits = text.split(",") # ['apple', 'banana', 'cherry'] ``` ##### 查找子串位置 利用 `find()` 或者 `index()` 可以找到某个子串首次出现的位置;如果找不到,则 `find()` 返回 `-1` 而 `index()` 抛出异常: ```python sentence = "Welcome to the jungle." position_find = sentence.find("jungle") # position_find=11 try: position_index = sentence.index("desert") except ValueError as e: print(e) # substring not found ``` ##### 替换子串 通过 `replace(old, new)` 将旧子串替换成新子串: ```python old_text = "I like cats and dogs." new_text = old_text.replace("cats", "rabbits") # I like rabbits and dogs. ``` ##### 大小写转换 支持多种大小写的转换方式,比如全部大写、首字母大写等: ```python lowercase = "hello".upper() # HELLO uppercase = "WORLD".lower() # world capitalized = "john doe".capitalize() # John doe titlecased = "john DOE".title() # John Doe ``` #### 特殊字符处理 ##### 去除空白字符 为了去除字符串两端多余的空格或其他空白字符,可以采用 `strip()` 方法。此方法会移除开头和结尾处所有的空白字符(包括空格、制表符 `\t` 和换行符 `\n`),但不会影响中间部分的任何空白字符[^2]。 ```python trimmed_string = ' hello there! '.strip() print(trimmed_string) # hello there! ``` #### 序列转字符串 当有一个由多个项组成的序列并希望将其组合成单一字符串时,可借助于 `join()` 方法。该方法接收一个迭代器作为参数,并用给定的分隔符把各个元素连在一起形成一个新的字符串对象[^3]。 ```python words_list = ["Python", "is", "awesome"] joined_sentence = "-".join(words_list) print(joined_sentence) # Python-is-awesome ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值