- 更新时间:2018-07-29
前言
这一系列博客主要介绍Pandas科学计算,使用Pandas进行数据科学计算更高效、更简单。
很多时候,需要对数据表进行处理,比如将表中数据按照某一列进行分组,之后存储成不同文件。
执行过程
下面代码实现了从filename0文件中按照“A“列进行分组,之后将每个分组存为该列的值:
import pandas as pd
header = ["A", "B", "C", "D"]
file = pd.read_csv(path + filename0, sep='\t', header=header)
for name,group in file.groupby("A"):
group.to_csv(path + filename, sep='\t', header=False, index=False)