简单介绍
1.先获取Series的str属性,然后在属性上调用函数
2.只能在字符串列上使用,不能数字列上使用
3.DataFrame上没有str属性和处理方法
4.Series.str并不是Python原生字符串,而是自己的一套方法,不多大部分和原生str很相似
代码演示
读取天气数据
ymd,bWenDu,yWenDu,tianQi,fengXiang,fengLi,aqi,aqiInfo,aqLevel
2018-01-01,3°C,-5°C,🌤,东北风,1-2级,59,良,2
2018-02-22,6°C,-4°C,☀,西南风,2-3级,66,良,1
2018-02-03,4°C,-5°C,☼,西风,5-6级,39,优,1
2018-04-05,5°C,-2°C,☂,北风,1-2级,43,优,1
2019-02-01,2°C,-6°C,☁,南风,1-2级,27,良,2
2019-10-23,3°C,-1°C,🌤,东风,1-2级,18,良,2
# 字符串替换函数
print(df['bWenDu'].str.replace("°C", ""))
# 判断是不是数字
print(df['bWenDu'].str.isnumeric())
condition = df['ymd'].str.startswith('2018-0')
print(condition)
print(df[condition].head())
第二行会出错,因为每次会返回一个Series类型的数据,并不是字符串,需要再次使用Series的str才可以使用
可以使用正则表达式这样写
df["中文日期"].str.replace("[年月日]","")