DataFrame常用属性及方法
首先创建一个DataFrame对象
import pandas as pd
import numpy as np
data = {'Name':pd.Series(['python编程','数据库','数据科学导论',\
'C语言','java程序设计','数据结构','计算机组成原理']),\
'Time':pd.Series([32,28,36,32,36,48,36]),\
'Credits':pd.Series([4,5,5,4,4,6,5])}
df = pd.DataFrame(data)
df
输出:
T转置使行和列进行交换
df.T
输出:
axes返回一个由行标签和列标签组成的列表
df.axes
输出:
[RangeIndex(start=0, stop=7, step=1),
Index(['Name', 'Time', 'Credits'], dtype='object')]
第一行RangeIndex为index行标签,分别指出了行标签的开始索引start,结束索引stop,步长step
第二行Index为columns列标签,指出了DataFrame各列的列名
dtypes返回每一列的数据类型
df.dtypes
输出:
Name object
Time int64
Credits int64
dtype: object
第一列为列名,第二列为数据类型
empty判空
df.empty
输出:
False
返回一个布尔值,判断输出的数据对象是否为空,若为 True 表示对象为空
ndim获取数据对象的维数
df.ndim
输出:
2
返回数据对象的维数,DataFrame 是一个二维数据结构,故返回2
shape获取DataFrame的维度
df.shape
输出:
(7, 3)
返回一个代表 DataFrame 维度的元组。返回值元组 (a,b),其中 a 表示行数,b 表示列数
size获取DataFrame中元素的个数
df.size
输出:
21
返回 DataFrame 中的元素数量,为行数×列数
Values获取DataFrame中的数据
df.values
输出:
array([['python编程', 32, 4],
['数据库', 28, 5],
['数据科学导论', 36, 5],
['C语言', 32, 4],
['java程序设计', 36, 4],
['数据结构', 48, 6],
['计算机组成原理', 36, 5]], dtype=object)
以ndarray数组的形式返回
使用head()和tail()查看数据
df.head(2)
df.tail(2)
分别输出:
head(),tail()分别默认返回前五行和后五行
shift()移动行和列
df.shift(periods=1)
DataFrame沿着y轴向下移动了一行,导致第一行数据均变为NaN,最后一行数据丢失
该函数并不改变原有的DataFrame