Python数据处理之excel
昨天同学请我帮一个忙:就是把如下excel中的人名实现excel表中的每一个名字按行存储,我想了下python应该可以实现这个,就着手做了起来。原始数据如下:
我先对原始数据进行了预处理,便于python读取,预处理之后如下:
我的思路是先把excel中的名字读取到一个txt文档中,之后再按行存储进一个新的excel。
首先,我将excel中的人名提取到了一个txt文档中,如下所示(我是用vscode打开的):
之后准备将每一个人名写入新的excel中,发现一个问题,这个数据有点不是很整洁,它的两个字的名字之间有空格,2个字的名字和3个字及以上的名字之间也存在着空格,这个在读取时就会造成把单个字也当成一个名字。之后我我观察了一个名字的分布形式,只有2个字的存在这种现象,于是写了一个判别代码,将2个字的名字进行整合,代码最后附上,实现的效果如下:
之后将新的txt中存储的名字写入excel中,效果如下:
我个人感觉还挺有趣的,可以用所学的知识解决一些实际的问题,可以提高数据处理的效率。
附代码:https://github.com/zigangzhao-ai/excel-data-disposal