数据划分处理(基于python的pandas中的dataframe数据结构)
我们常常需要从一个表格中,得到相关的子表格。
正如问题:按国家,从原始资源表中得到金银铜的年储量变化。(如图所示)
比较简单的做法可以是:多重循环
但小编往往不会满足于这样的处理方式,相反更偏向于使用相关的已有的函数,对整个表格同时进行处理。
分析上述实际问题,如果先按国家(魏、蜀、吴)划分为三个数据集,则储量可由(资源名、年份)唯一确定。
正如 df['金']['1960'] = 11,其中df为事先生成的空的dataframe。
data_Shu = data[data['国家'] == '蜀']
data_Wu = data[data['国家'] == '吴']
data_Wei = data[data['国家'] == '魏']
data_Shu的结果为:
资源名 国家 年份 储量
0 金 蜀