python DataFrame创建及基本操作

最新推荐文章于 2022-07-02 11:23:20 发布

Foina数据分析狮

最新推荐文章于 2022-07-02 11:23:20 发布

阅读量3.6w

点赞数 6

分类专栏： python 文章标签： DataFrame 创建

本文链接：https://blog.csdn.net/xiaoxiaoliluo917/article/details/85265736

版权

python 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1.DataFrame创建

pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

data：numpy ndarray(结构化或同类)，dict或DataFrame，Dict可以包含Series，数组，常量或类似列表的对象

index：dataframe的索引，如果没有自定义，则默认为RangeIndex(0,1,2，…，n)

columns：dataframe的列标签，如果没有自定义，则默认为RangeIndex(0,1,2，…，n)

dtype：默认None，要强制的数据类型。只允许一个dtype

copy：boolean，默认为False

# 从np.array 转换为 pd.DataFrame
data = np.array([['','Col1','Col2'],
                ['Row1',1,2],
                ['Row2',3,4]])

pd.DataFrame(data=data[1:,1:],
             index=data[1:,0],
             columns=data[0,1:])

#      Col1 Col2
# Row1    1    2
# Row2    3    4

# 直接采用字典做参数
my_dict = {1: ['1', '3'], 2: ['1', '2'], 3: ['2', '4']}
print(pd.DataFrame(my_dict))
#    1  2  3
# 0  1  1  2
# 1  3  2  4

# 用一个DataFrame做输入参数
my_df = pd.DataFrame(data=[4,5,6,7], index=range(0,4), columns=['A'])
print(pd.DataFrame(my_df))
#    A
# 0  4
# 1  5
# 2  6
# 3  7

# 输入一个Series
my_series = pd.Series({"United Kingdom":"London", "India":"New Delhi", "United States":"Washington", "Belgium":"Brussels"})
print(pd.DataFrame(my_series))
#                          0
# Belgium           Brussels
# India            New Delhi
# United Kingdom      London
# United States   Washington

需要注意，以字典的方式创建，字典的键当做DataFrame的列名，当每个键对应的value值的个数为1时，必须输入index；以Series的方式创建，Series的索引是DataFrame的索引。