尽管这一系列的文章介绍如何用pandas处理excel表格,因此这里的DataFrame大部分来自excel文件,但是在使用和学习的过程中,依然存在这把一些Python中常见数据类型转化DataFrame的场景:
- 对数据处理的过程中,用Python数据类型临时存放,最终转化成DataFrame;
- 随手生成DataFrame,通过观察该数据类型的行为学习Pandas。
后一种场景是初学pandas和初学各类编程语言时,常用的“伎俩”。由于新设计的编程语言均有“自省”功能,很多时候在网上查手册,不如直接试试看。
整体来说,Python中的任何具有类二维结构数据,均可以自动转化为DataFrame。那么什么是“类二维结构数据“呢?就是类似于一个表格,有行列之分。
例如由两个列表构成的数据如下
a=[[1,2,3],['x','y','z']]
,通过DataFrame函数转化为下图。注意由于没有指定“行列指标”,因此默认均用从0开始的数列表示。
将上面的情况推而广之,不难看出,用List和Tuple互相嵌套,构成的二维结构都可以