python以字典初始化数据_创建DataFrame:python中用字典初始化DF数据帧

DataFrame是pandas数据处理中一种很常用的数据结构。我们可以把DataFrame看成是一张二维数据表,相对于Series数结构,DataFrame可以由多列,因此他的功能比Series更加强大,我们可以把DataFrame看成是一张excel表格的sheet,用它就可以完成很多原来excel需要手动完成的工作,从而实现数据处理自动化了,想想也是很激动的。

首先,我们要学会如何创建DataFrame数据结构,python中我们可以使用字典作为参数,利用DataFrame的构造函数对数据帧进行初始化。这点其实Series数据结构也是一样的。特别要注意的是,DataFrame的D和F要大写,其实Series的S也是要大写的,不大写的话python会报错。

我们可以使用以下的代码来进行演示:

import pandas as pd

dict_data = {

'student':["Li Lei","Han Meimei","Tom"],

'score':[95,98,92],

'gender':['M','F','M']

}

df_data = pd.DataFrame(dict_data)

print(df_data)

运行之后得到以下结果:

student score gender

0 Li Lei 95 M

1 Han Meimei 98 F

2 Tom 92 M

[Finished in 3.9s]

可以看到,这个字典的key值,作为了DataFrame数据每一列的表头,按照数据库的规定可以叫作字段,在DF数据中,我们使用columns参数用来存放这些表头信息。字典的value是一个列表,列表中第n个元素对应了这个字段下面第n行的值。我们注意到,DF为我们自动生成了index索引,也就是第0列的数字编号0/1/2。这个也可以用来做行号的索引。当然我们也可以修改索引,这点和Series是一样的。

看数据结果,确实非常像一张excel表格,nice!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值