Python保留指定字符

最新推荐文章于 2024-07-30 17:25:35 发布

bingbangx

最新推荐文章于 2024-07-30 17:25:35 发布

阅读量3.1k

点赞数

分类专栏： Python

原文链接：https://blog.csdn.net/lxx199603/article/details/107356610/

版权

Python 专栏收录该内容

113 篇文章 13 订阅

订阅专栏

本文介绍了Python中strip()、lstrip()和rstrip()函数用于去除字符串头尾空白符的方法，以及replace()函数结合正则表达式的使用，演示了如何保留特定字符并删除其余内容。示例代码展示了如何分别保留汉字、小写字母、数字和字母数字组合，以及提取非指定字符。

摘要由CSDN通过智能技术生成

一、strip()、lstrip()、rstrip()

strip：用来去除头尾字符、空白符(包括\n、\r、\t、' '，即：换行、回车、制表符、空格)
lstrip：用来去除开头字符、空白符(包括\n、\r、\t、' '，即：换行、回车、制表符、空格)
rstrip：用来去除结尾字符、空白符(包括\n、\r、\t、' '，即：换行、回车、制表符、空格)

注意：这些函数都只会删除头和尾的字符，中间的不会删除
原文链接：https://blog.csdn.net/weixin_38740463/article/details/97660704

二、replace()函数

使用replace只保留数字（和dot和minus符号）这将删除字符、字母或to_replace属性中未定义的任何内容。

参考：https://www.cnpython.com/qa/45598

参考：https://stackoverflow.com/questions/13682044/remove-unwanted-parts-from-strings-in-a-column

正则表达式 \D 来删除任何非数字字符

正则表达式网站：https://www.regular-expressions.info/shorthand.html。

正则是个好东西。

re里面的功能太多太杂，为了简单方便，统一只记一个函数：findall()

import re

mystr = "hahaAAA哈哈123./!#"

str1 = ''.join(re.findall('[\u4e00-\u9fa5]',mystr)) # 只保留汉字
print(str1)

str2 = ''.join(re.findall('[a-z]',mystr)) # 只保留小写字母
print(str2)

str3 = ''.join(re.findall('[0-9]',mystr)) # 只保留数字
print(str3)

str4 = ''.join(re.findall('[a-zA-Z0-9]',mystr)) # 只保留字母和数字
print(str4)

str5 = ''.join(re.findall('[^\u4e00-\u9fa5^a-z^A-Z^0-9]',mystr))
# 只保留除了汉字、字母、数字以外的字符
print(str5)