[pandas基础]Pandas DataFrame进阶操作

DataFrame常用属性及方法

首先创建一个DataFrame对象

import pandas as pd
import numpy as np

data = {'Name':pd.Series(['python编程','数据库','数据科学导论',\
                      'C语言','java程序设计','数据结构','计算机组成原理']),\
    'Time':pd.Series([32,28,36,32,36,48,36]),\
    'Credits':pd.Series([4,5,5,4,4,6,5])}
df = pd.DataFrame(data)
df

输出:

T转置使行和列进行交换

df.T

输出:

axes返回一个由行标签和列标签组成的列表

df.axes

输出:

[RangeIndex(start=0, stop=7, step=1),
 Index(['Name', 'Time', 'Credits'], dtype='object')]

第一行RangeIndex为index行标签,分别指出了行标签的开始索引start,结束索引stop,步长step

第二行Index为columns列标签,指出了DataFrame各列的列名

dtypes返回每一列的数据类型

df.dtypes

输出:

Name       object
Time        int64
Credits     int64
dtype: object

第一列为列名,第二列为数据类型

empty判空

df.empty

输出:

False

返回一个布尔值,判断输出的数据对象是否为空,若为 True 表示对象为空

ndim获取数据对象的维数

df.ndim

输出:

2

返回数据对象的维数,DataFrame 是一个二维数据结构,故返回2

shape获取DataFrame的维度

df.shape

输出: 

(7, 3)

返回一个代表 DataFrame 维度的元组。返回值元组 (a,b),其中 a 表示行数,b 表示列数

size获取DataFrame中元素的个数

df.size

输出:

21

返回 DataFrame 中的元素数量,为行数×列数

Values获取DataFrame中的数据

df.values

输出:

array([['python编程', 32, 4],
       ['数据库', 28, 5],
       ['数据科学导论', 36, 5],
       ['C语言', 32, 4],
       ['java程序设计', 36, 4],
       ['数据结构', 48, 6],
       ['计算机组成原理', 36, 5]], dtype=object)

以ndarray数组的形式返回

使用head()和tail()查看数据

df.head(2)
df.tail(2)

分别输出:

head(),tail()分别默认返回前五行后五行 

shift()移动行和列

df.shift(periods=1)

 DataFrame沿着y轴向下移动了一行,导致第一行数据均变为NaN,最后一行数据丢失

该函数并不改变原有的DataFrame

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值