1.字符串查找类:find , index
- find:查找字符串中是否包含子串。
- 返回第一次找到字串的位置,从0开始。返回-1则没有找到
- 使用的时候还可以设置区间
- index:跟find的唯一区别是没有找到会引发异常,即报错
- rfind,lfind:从左开始查找或者从右开始查找。但这python好像没有lfind查找。
2.判断类函数
-
此类函数的特点是一般都用is开头,比如islower
-
isalpha:判断是否是字母,需要注意的两点:
- 此函数默认的前提是字符串至少包含一个字符,如果没有,同样返回False
- 汉字被认为是alpha,所以,此函数不能作为区分英文字母还是汉字的标识。区分中英文使用unicode 码。
- 返回为True或者False,只包括汉字或字母的才为True
-
isdigit,isnumeric,isdecimal三个判断数字的函数
此类函数不建议使用,在后期爬虫中,判断是否是数字建议使用正则表达式的方法
-
islower:判断字符串是否小写.Return True if the string is a lowercase string, False otherwise
-
isupper:判断字符串是否是大写.
3.内容判断类
- startswith/endswith:是否以xxx开头或结尾
- islower/isupper:判断字符串是小写还是大写。一般是英文字母判断
4.操作类函数
- format:格式化用的
- strip:这个函数主要作用是删除字符串两边的空格,还可以去定义删除字符串两边的那个字符。需要注意的是,此处的删除不是删除一个,是指从头开始符合条件的连续字符。
- lstrip/rstrip,分别表示左边右边,即删除字符串左边或者右边特定字符
- join:这个函数主要对字符串进行拼接。它需要一个可以迭代的内容作为参数(迭代以后会学,暂时理解成一个列表),功能是把可迭代的字符串拼接在一起,中间使用调用字符串作为分隔符。