数据科学入门与实战:玩转pandas之二

Series,DateFrame的排序功能

引入相关的包


import numpy as np
import pandas as pd
from pandas import Series,DataFrame

建立一个serious

s1 = Series(np.random.randn(10))#返回一个标准正态分布的array

打印一下serious,和其值,索引的情况
在这里插入图片描述
按照值对它排序

s2 = s1.sort_values(ascending=True)#从小到大
print(s2)

在这里插入图片描述
根据索引进行排序

print(s2.sort_index())

在这里插入图片描述

对DataFrame的排序

创建df1

df1 = DataFrame(np.random.randn(40).reshape(8,5),
                columns=['A','B','C','D','E'])
print(df1)

在这里插入图片描述
按照第一列A的值进行排(从小到大)并且只打印第一列的值

#按照第一列进行排序
print(df1['A'].sort_values())

在这里插入图片描述

按照第一列A的值进行排序,别的B,C,D…也要随之排列

df2 = df1.sort_values('A',ascending=False)
print(df2)

在这里插入图片描述

按照标签排序

print(df2.sort_index())

在这里插入图片描述
作业:
读取movie_metadata.csv里面的三列数据,并且按照imdb_score从小到大进行排序,并且存入imdb.csv文件之中

csv_input = 'F:\learn\datescience_learn\movie_metadata.csv'
pd.read_csv(csv_input)[['director_name','movie_title','imdb_score']].sort_values('imdb_score',ascending=False).to_csv('imdb.csv')

在这里插入图片描述
查看文件似乎当时我自己还使用了另外一种方法

#另一种方法loc
print(pd.read_csv(csv_input).loc[:,['director_name','movie_title','imdb_score']])

然而好像不对…复习的时候得看看吧
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值