Series,DateFrame的排序功能
引入相关的包
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
建立一个serious
s1 = Series(np.random.randn(10))#返回一个标准正态分布的array
打印一下serious,和其值,索引的情况
按照值对它排序
s2 = s1.sort_values(ascending=True)#从小到大
print(s2)
根据索引进行排序
print(s2.sort_index())
对DataFrame的排序
创建df1
df1 = DataFrame(np.random.randn(40).reshape(8,5),
columns=['A','B','C','D','E'])
print(df1)
按照第一列A的值进行排(从小到大)并且只打印第一列的值
#按照第一列进行排序
print(df1['A'].sort_values())
按照第一列A的值进行排序,别的B,C,D…也要随之排列
df2 = df1.sort_values('A',ascending=False)
print(df2)
按照标签排序
print(df2.sort_index())
作业:
读取movie_metadata.csv里面的三列数据,并且按照imdb_score从小到大进行排序,并且存入imdb.csv文件之中
csv_input = 'F:\learn\datescience_learn\movie_metadata.csv'
pd.read_csv(csv_input)[['director_name','movie_title','imdb_score']].sort_values('imdb_score',ascending=False).to_csv('imdb.csv')
查看文件似乎当时我自己还使用了另外一种方法
#另一种方法loc
print(pd.read_csv(csv_input).loc[:,['director_name','movie_title','imdb_score']])
然而好像不对…复习的时候得看看吧