一、pandas数据排序
1、series的排序
Series.sort_values(ascending=True, inplace=False)
参数说明:
- ascending:默认为True:升序排序,为False降序排序
- inplace:True修改原始数据 False不修改原数据
data["pm2.5"].sort_values(ascending=True, inplace=False)
2、DataFrame的排序
DataFrame.sort_values(by,ascending=True, inplace=False)
参数说明:
- by:字符串或者list<字符串>,单列排序或者多列排序
- ascending:默认为True:升序排序,为False降序排序
- inplace:True修改原始数据 False不修改原数据
#单列排序
data.sort_values(by="pm2.5", ascending=True, inplace=False)
#多列排序
data.sort_values(by=["pm2.5","PRES"], ascending=True, inplace=False)
#分别指定升序和降序
data.sort_values(by=["pm2.5","PRES"], ascending=[True,False], inplace=False)
二、字符串处理
- 使用方法:先获取Series的str属性,然后在str属性上调用函数
- 只能在字符串列上使用,不能在数字列上使用
- DataFrame上没有str属性和处理方法
- Series.str并不是python原生字符串,而是自己的一套方法,大部分和原生str相似
1、字符串替换函数
#判断是不是数字
data