目录
1. 什么是DataFrame
与R语言中的数据框frame相似,是将数据存储在二维矩阵中的方法。
由于其可以储存各种类型的数据(bool, int, float, date, string…),因而在数据分析中被广泛应用。
2. 创建DataFrame
2.1 直接创建
import pandas as pd
df = pd.DataFrame([['a', 'b'], ['c', 'd']],
index=['row_1', 'row_2'],
columns=['col_1', 'col_2'])
print(df)
print(type(df))
输出结果为:
col_1 col_2
row_1 a b
row_2 c d
<class 'pandas.core.frame.DataFrame'>
index & columns可以省略,缺省第二个参数为index,第三个参数为columns。
index & columns为可选参数。如果缺失,则默认为从0开始的整数。
Numpy.array可以直接转换成DataFrame。
import numpy as np
df2 = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]