pandas 处理

pandas 基础处理部分

pandas是什么
数据结构
基础操作
运算
画图

pandas是什么

数据处理工具
pannel + data + analysis
面板 计量经济学 三维数据

边界数据处理能力
读取文件方便
封装matplotlib 和 numpy 方便计算

三大pandas数据结构

dataframe
panel
series

Dataframe

既有行索引,又有列索引的二维数组

import pandas as pd
import numpy as np
data = np.random.normal(0,1,(10,5))
data2 = pd.DataFrame(data)
data2

在这里插入图片描述

data = np.random.normal(0,1,(10,5))
data = pd.DataFrame(data)
# 添加行索引
row_names = ['股票{}'.format(i) for i in range(10)]
# 添加列索引
date = pd.date_range(start='20180101',periods=5,freq='B')
pd.DataFrame(data,index = row_names,columns = date)

在这里插入图片描述
属性:
shape
index
columns
vales
T

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

索引的设置

设置新索引
行列索引只能集体修改,不能单独修改某个行/列的索引值
在这里插入图片描述
在这里插入图片描述

重置索引
在这里插入图片描述

data.reset_index()

在这里插入图片描述

data.reset_index(drop = True)

在这里插入图片描述

设置多个索引
在这里插入图片描述
在这里插入图片描述
multilndex 和pannel

pandas 高级处理部分

缺失值处理

删除缺失值

替换/插补

如何处理nan

判断是否存NaN

pd.isnull(df)
pd.notnull(df)

删除缺失值
默认按行去删除
df.dropna()

df.dropna(axis = 'row')

inplace参数 True就地删除,False不修改原值
df.drop(inplace=Flase) 默认false

替补插补

df.fillna(value, inplace = Flase)
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值