数据科学库-pandas

pandas的常用数据类型:

1.Series 一维,带标签数组

2.DataFrame 二维,Series容器



series创建

t = pd.Series(np.arange(10),index = list.ascii_uppercase[:10]))

A        0

B        1

C        2

D        3

E        4

F        5

G       6

H       7

J        8

K       9

pandasSeries切片和索引:

 

pandasSeries的索引和值:

 

pandas读取外部数据:

pd.read_csv

pandasDataFrame:

DataFrame对象既有行索引,又有列索引

行索引,表明不同行,横向索引,叫index0轴,axis=0

列索引,表名不同列,纵向索引,叫columns1轴,axis=1

pandasloc :

还有更多的经过pandas优化过的选择方式:

1. df.loc 通过 标签 引行 数据
2. df.iloc 通过 位置 取行 数据

 

赋值更改数据的过程:

 pandas之布尔索引

 

缺失数据的处理:

判断数据是否为NaNpd.isnull(df),pd.notnull(df)

处理方式1:删除NaN所在的行列dropna (axis=0, how='any', inplace=False)

处理方式2:填充数据,t.fillna(t.mean()),t.fiallna(t.median()),t.fillna(0)

处理为0的数据:t[t==0]=np.nan

当然并不是每次为0的数据都需要处理

计算平均值等情况,nan是不参与计算的,但是0

 

pandas常用统计方法

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值