之前已经有分享如何使用Pandas创建DataFrame的五种方式如下,大家可以看看:郭小瑄:Pandas数据结构:5种Dataframe创建方式zhuanlan.zhihu.com
对我来说比较容易搞混的是第四和第五种方式,即:由字典组成的列表以及由字典组成的字典
接下来我将分享以下的练习,是让我能比较清楚这两种创建DataFrame的方式。
练习题目
创建成下图的DataFrame。图中为:每位学生与其各科成绩结果
从图可得知,
index = Math, English, Art (三个学科)
columns = Jack, Marry, Tom (三位学生的名字)
(4) 由字典组成的列表
模式为列表 [ ] 在字典的外面{ }
这种方式是将列表的每一个字典视为一个(行)数据
data1 = [{'Jack':90, 'Marry': 82, 'Tom':78},
{'Jack':89, 'Marry':95, 'Tom':67},
{'Jack':78, 'Marry':92}]
print(pd.DataFrame(data1, index = ['Math','English','Art'], columns=['Jack','Marry','Tom']))
print('--------')
编写完成后使用print去创建DataFrame,并且标注index三个学科名,以及columns的顺序。
(5) 由字典组成的字典
这里就没有任何列表了,都是使用字典 { } 但其实这看起来更容易了
三位学生名都是字典的key,其value值则再使用字典模式,里面就是该学生(key)的三项科目成绩。从此可知,Columns和index都很清楚。
data = {'Jack':{'Math':90,'English':89,'Art':78},
'Marry':{'Math':82,'English':95,'Art':92},
'Tom':{'Math':78,'English':67}}
print(pd.DataFrame(data, index=['Math','English','Art']))
编写完成后使用print去创建DataFrame,只需要标注index的顺序即可。
由上述两种方式print出来的结果如图
以上就是为创建DataFrame的第四第五种方式,希望大家通过我的分享能更清楚由字典组成的列表以及由字典组成的字典去创建的DataFrame的差异。
结束。