2.DataFrame属性和方法

1. DataFrame属性

import pandas as pd
nba = pd.read_csv('nba.csv', parse_dates=['Birthday'])
nba

在这里插入图片描述

nba.dtypes

在这里插入图片描述

nba.index

RangeIndex(start=0, stop=450, step=1)
start-索引下限,stop-索引上限,step-步长

nba.columns

Index([‘Name’, ‘Team’, ‘Position’, ‘Birthday’, ‘Salary’], dtype=‘object’)

# DateFrame 维数 返回整型
nba.ndim

2

# DateFrame 维数 返回元组
nba.shape

(450, 5)

nba.size

2250,size属性包含了缺失值(NaN)

nba.count()

2250,count方法不计算缺失值(NaN)

#size和count()的区别
import numpy as np
data = {
    'a':[1, 2],
    'b':[3, np.nan]
}
test = pd.DataFrame(data)
test.size
test.count()

在这里插入图片描述
test.size = 4
在这里插入图片描述

2. DataFrame方法

head – 获取前面n条数据
tail – 获取尾部n条数据
默认参数都为5

nba.head(3)
nba.tail(4)

sample – 随机抽取数据,默认为1条

nba.sample(6)

nunique – 计算唯一值
数据表示NBA中有30支队伍,有9种位置和269种薪资。

nba.nunique()

在这里插入图片描述

nba.max()

每个column的最大值,nba.min()用法相同
在这里插入图片描述

# 找出年龄最大的5条数据
nba.nlargest(5, columns='Birthday')

在这里插入图片描述

# 找出3条工资最低的数据
nba.nsmallest(3, columns='Salary')

在这里插入图片描述
nlargest、nsmallest方法只能在数字或者日期列上调用,否则报错。

nba.sum()

在这里插入图片描述
非数字栏字符串连接起来,没有意义,一般加上numeric_only=True,只计算数字。

nba.sum(numeric_only=True)

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值