Pandas基本操作

Pandas基本操作

import pandas as pd
import numpy as np
  • Series类似一位数组的用法
>>> a=pd.Series(['a',1,'e',2,np.nan,66])
>>> a
0      a
1      1
2      e
3      2
4    NaN
5     66
dtype: object
  • DataFrame构建数据框,index和columns分别可以设置行和列名:
>>> tf = pd.DataFrame(np.random.randn(6,4),index=['a','b','c','d','e','f'])
>>> tf
          0         1         2         3
a -1.547627  0.507147 -1.243817 -0.472008
b  0.212566 -0.160688 -0.450790 -1.311296
c  1.636306 -0.656181  1.189830 -0.185942
d  0.195594  0.229884  0.760757  0.167061
e  0.999479 -0.133732  0.318888  0.392381
f  1.566487 -0.956839  0.841864 -1.084695
  • 用字典的形式导入DataFrameTimestamp构造时间;Categorical构造分类变量。
>>> tf1 = pd.DataFrame({'A':1.,'B':pd.Timestamp('20180816'),'C':pd.Series([3]*5),'D':pd.Categorical(['ss','d','fg','ew','g']),'E':np.array([2]*5,dtype='int64'),'F':np.arange(5)})
>>> tf1
     A          B  C   D  E  F
0  1.0 2018-08-16  3  ss  2  0
1  1.0 2018-08-16  3   d  2  1
2  1.0 2018-08-16  3  fg  2  2
3  1.0 2018-08-16  3  ew  2  3
4  1.0 2018-08-16  3   g  2  4
  • sort_valuessort_index可以将DataFrame对值和行列名进行排序。其中,sort_values的by= 可以指定列,ascending= 可以指定方向。对于 sort_index,axis=1是对列名排序,axis=0对行名排序。
>>> tf1.sort_values(by='F',ascending=False)
     A          B  C   D  E  F
4  1.0 2018-08-16  3   g  2  4
3  1.0 2018-08-16  3  ew  2  3
2  1.0 2018-08-16  3  fg  2  2
1  1.0 2018-08-16  3   d  2  1
0  1.0 2018-08-16  3  ss  2  0
>>> tf1.index
RangeIndex(start=0, stop=5, step=1)
>>> tf1.columns
Index(['A', 'B', 'C', 'D', 'E', 'F'], dtype='object')
>>> tf1.sort_index(axis=1,ascending=False)
   F  E   D  C          B    A
0  0  2  ss  3 2018-08-16  1.0
1  1  2   d  3 2018-08-16  1.0
2  2  2  fg  3 2018-08-16  1.0
3  3  2  ew  3 2018-08-16  1.0
4  4  2   g  3 2018-08-16  1.0
>>> tf1.sort_index(axis=0,ascending=False)
     A          B  C   D  E  F
4  1.0 2018-08-16  3   g  2  4
3  1.0 2018-08-16  3  ew  2  3
2  1.0 2018-08-16  3  fg  2  2
1  1.0 2018-08-16  3   d  2  1
0  1.0 2018-08-16  3  ss  2  0
  • 修改列名
tf1.rename(columns = {'key':'key2'},inplace=True)

数据清洗,排序,索引设置,数据选取
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值