一、strip()、lstrip()、rstrip()
strip: 用来去除头尾字符、空白符(包括\n、\r、\t、' ',即:换行、回车、制表符、空格)
lstrip:用来去除开头字符、空白符(包括\n、\r、\t、' ',即:换行、回车、制表符、空格)
rstrip:用来去除结尾字符、空白符(包括\n、\r、\t、' ',即:换行、回车、制表符、空格)
注意:这些函数都只会删除头和尾的字符,中间的不会删除
原文链接:https://blog.csdn.net/weixin_38740463/article/details/97660704
二、replace()函数
使用replace
只保留数字(和dot
和minus
符号) 这将删除字符、字母或to_replace
属性中未定义的任何内容。
参考:https://www.cnpython.com/qa/45598
参考:https://stackoverflow.com/questions/13682044/remove-unwanted-parts-from-strings-in-a-column
正则表达式 \D 来删除任何非数字字符
正则表达式网站:https://www.regular-expressions.info/shorthand.html。
正则是个好东西。
re里面的功能太多太杂,为了简单方便,统一只记一个函数:findall()
import re
mystr = "hahaAAA哈哈123./!#"
str1 = ''.join(re.findall('[\u4e00-\u9fa5]',mystr)) # 只保留汉字
print(str1)
str2 = ''.join(re.findall('[a-z]',mystr)) # 只保留小写字母
print(str2)
str3 = ''.join(re.findall('[0-9]',mystr)) # 只保留数字
print(str3)
str4 = ''.join(re.findall('[a-zA-Z0-9]',mystr)) # 只保留字母和数字
print(str4)
str5 = ''.join(re.findall('[^\u4e00-\u9fa5^a-z^A-Z^0-9]',mystr))
# 只保留除了汉字、字母、数字以外的字符
print(str5)
原文链接:https://blog.csdn.net/lxx199603/article/details/107356610/
注:仅学习记录之用。