目录
数据的分组与汇总
import numpy as np
import pandas as pd
import os
1 排序
loan_info = pd.read_csv('loan_info.csv', encoding='utf-8', dtype={
'hkzh': str})
loan_info.info()
loan_info.head(5)
loan_info.sort_values('dkje', ascending=True, na_position='last', inplace=True)
# ascending=True:升序,na_position='last':缺失值排最后面,inplace =True表示是否作用在原数据上
loan_info.sort_values('ye', ascending=True, na_position='first')
# 升序(缺失值排最前面)
loan_info.sort_values(['dkje', 'ye']) # 注意没有加inplace = True表示返回的是视图,没有作用在原数据上
2 找最大最小值
2.1使用nlargest 和nsmallest方法
loan_info.nlargest(2, 'dkje') # 查看贷款金额最大的两个
loan_