dataframe是一种表格型的数据存储结构,可以看作是几个serie的集合。dataframe既有行索引,也有列索引。
以下代码环境为google colab/jupyter notebook。
接下来就对dataframe的基本使用进行整理。
dataframe也从属于pandas模块,因此还是老规矩,先import pandas。
import pandas as pd
import numpy as np
1. dataframe的创建
dataframe的创建有很多方法,下面列举了几种主要的创建方法。
a. 通过numpy ndarray创建dataframe
在创建dataframe时,可以自定义行索引index和列索引columns。
arr = np.random.randn(6,4)
index_rows = pd.date_range('today', periods=6)
index_columns = ['A','B','C','D']
dataframe1 =
pd.DataFrame(arr,index=index_rows,columns=index_columns)
dataframe1
运行结果:
b. 通过字典dictionary创建dataframe
data = {
'country': ['China','Japan','France'],
'capital': ['Beijing','Tokyo'