Numpy提供了强大的多维数组对象ndarray,而pandas则在此基础上提供了更高级的数据结构DataFrame,使得数据分析变得更加方便。
以下是使用numpy ndarray创建DataFrame的步骤和示例:
- 导入所需的库
首先,需要从numpy和pandas库中导入ndarray和DataFrame。
import numpy as np
import pandas as pd
- 创建numpy ndarray
创建一个numpy数组,它可以是一维的,也可以是多维的。
创建一个一维numpy数组
array_1 = np.array([1, 2, 3, 4, 5])
创建一个二维numpy数组
array_2 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
- 使用numpy ndarray创建DataFrame
将numpy数组传递给DataFrame构造函数,从而创建一个DataFrame对象。
使用一维numpy数组创建DataFrame
df_1 = pd.DataFrame(array_1, columns=['Column1'])
使用二维numpy数组创建DataFrame
df_2 = pd.DataFrame(array_2, columns=['A', 'B', 'C'])
- 查看DataFrame
使用print函数查看创建的DataFrame。
print(df_1)
print(df_2)
注意事项
当使用一维数组创建DataFrame时,会得到一个单列的DataFrame。
当使用二维数组创建DataFrame时,你需要[提供列名],以便区分数组的行和列,映射到DataFrame的结构中。
如果二维数组的行数和列数与列名的数量不匹配,pandas会报错。
或者也可以创建一个没有列名的DataFrame,pandas会自动生成默认的列名(如0, 1, 2等)。