Pandas DataFrame 日常的操作与发现

import numpy as np
import pandas as pd

一,选择数据

当使用ix[a,b]精确取元素时,a取df的index值。例子中end_time为df的index

a = df.ix[end_time,0]


但是使用iat[m,n]精确取元素时,第一个arg不能为index,必须为行的行号


二. 与Matrix,数组转换

csv文件的数据是N行一列,将它读取到程序保存为一维数组。

df = pd.read_csv('filename.csv',header = None)
mat = df[0].T.as_matrix()
list_1 = list(mat)


三.空值处理(NaNNone


df.fillna(0) 
df.fillna({1:0,2:0.5}) #对第一列nan值赋0,第二列赋值0.5
df.fillna(method='ffill') #在列方向上以前一个值作为值赋给NaN
df.fillna(method='bfill',limit=1) #<span lang="zh-CN" style="font-family:宋体">表示用后一个数据代替</span><span lang="en-US" style="font-family:
'MV Boli'">NaN</span>
df.fillna(df.mean()) #<span lang="zh-CN" style="font-family:宋体">表示用平均数或者其他描述性统计量来代替</span><span lang="en-US" style="font-family:'MV Boli'">NaN</span>


四. 合并


横着,并排,以行为单位

result = pd.concat([df1, df4], axis=1)
result = pd.concat([df1, df4], axis=1, join='inner')
result = pd.concat([df1, df4], axis=1, join_axes=[df1.index])



  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值