首先引入一个概念,python这个语言里面有很多很成熟的“包”,也就是各种操作的moudle,对于某一个特定的project里面的code,我们可以调用各种各样的包来帮助我们完成某些操作,这里不由得感叹一句,那些开发出这些包的人真的是蛮厉害的
在调用这些interpreter之前,我们要先加载这些包,这个操作可以在Pycharm里面进行,preference->Project: Projectname->Project interpreter->"+" sign
加载包们的窗口
读了一些各位大牛的博客之后发现,好像python的话常用来操作excel的有这个openpyxl,xlwt,xlrd等等,大概看了看大佬们的推荐,感觉openpyxl的功能比较全面,而且只有一个包就够了
各个操作excel的python包的功能对比
好像这个的缺点是处理数据需要的时间相对来说比较长,不过我的数据处理量也没有那么大,于是就选择了openpyxl这个包来折腾
首先明确一下这个脚本的目的,就是读取从server上下载的.dat文件,这个文件里面的格式大概是这样的
.dat 文件的样子(可能已经有人发现了是bader的输出文件)
对于这样一个文件,我们把它转换成Excel的文件会更容易进行直观的编辑,我们想要的结果大概是这样的
希望他变成.xlsx的文件的样子
而我们有一大堆这样的文件,分别处于以规律的数字命名的directory里(其实也就是提交job时候的文件夹),于是我们就需要一个script来分别打开这样的.dat文件,再把他们写入到一个workbook里面ÿ