简要
利用python实现把一个工作表中的某些列,和其中单独的一列,提取成为一个个新表。
如图(处理前)蓝色部分是需要保留的列,红色是需要一项一项分出来作为单独表格的列。
其中,第一行的名字是用的回车作为分隔,所以在提取名字时需要去除\n。
整体思路就是先保留前六列,然后加上后面的每一列,每加一列的同事加一个单独的sheets,最后获取第一行每一列的名字,将sheets进行命名。
如图(处理后)分出来的省份变为了文件名,列为专业人数,并且去除了空值。
1、导入文件
首先import panda as pd,随后通过pd.panda 导入工作表。
data = pd.read_excel("D:\\PycharmProjects\\hellow\\excel\