python sort_values函数_1、pandas使用sort_values排序

在创建DataFrame前,我们先生成随机数。(随机数在练习的时候很常用。) Numpy库的randn函数能生成多个随机数。

生成随机数

还可以用Numpy的arange函数 生成一个list,可以用作DataFrame的索引。我个人比较喜欢用arange,括号里是(起点值,终点值+1,步长)

生成列表作为索引

生成一个完整的DataFrame:

生成DataFrame

DataFrame有多个参数:data就是要转换成DataFrame的内容,很多数据类型都可以转换成DataFrame,比如:Series,字典,元组等等。如果是字典转换的话,“键”就默认是列名了。index是索引,columns是列名。

如果在转换成DataFrame时,没有指定index 和columns,系统会自动设定,都是从0开始的整数。

默认索引和列名

可以使用dtypes来查看各列的数据格式,info函数可以查看整个DataFrame的属性信息。

dtypes和info函数

查看前几行和后几行数据,括号里选择行的参数:

选择前后几行

对数值数据进行统计各类指标:

数值统计描述函数describe

一般分类数据用value_counts(后续会讲),数值数据用describe,这是最常用的两个统计函数。

选择数据的行、列索引和数值:

选择行、列索引和数值

行列转换:

转置函数T

还有一个转置函数unstack,用法有些许的区别。

unstack转置

对数据进行排序,用到了sort_values,by参数可以指定根据哪一列数据进行排序,ascending是设置升序和降序(选择多列或者多行排序要加[ ],把选择的行列转换为列表,排序方式也可以同样的操作)。

排序

sort_values

sort_values其它参数:axis=0或者1 纵向排序还是横;na_position='last' 将空值排在最后;kind和inplace是排序的具体方式,一般数据用不到。

sort_values其它参数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值