这两天在计算机学院处理数据要抓狂了(一边学excel一边用excel),可能这就是大学生吧(编外研究生刘某)。一些经历经验如下。
怎么去删去重复的数据(一般是一次几十条)?我们也发现了自己的一些考虑不周的地方。比如在某科目有挂科记录的学生,不一定最后在该学科挂科(因为可能有补考通过的现象)。再比如我一开始数据筛选不到位,没有过多进行筛选就去工作,结果没发现分给自己的A类数据表不全是A类数据,B类和C类也都在里面。我们不断地发现问题,解决问题。在基本处理完excel数据后,使用for循环去遍历,读取目标excel数据,并存储到自己建立的数据处理对象中。可以采用pandas中的Dataframe。
事后回顾,我觉得像这样的大规模数据处理把大体方案确定正确是很重要的,要不然贼亏,一个思路上的小错误乘个几万,就成了一个让人不想处理的大错误。值得一说的是,在这次数据处理预先思路上,我和我哥商讨的补集思想和列处理还是很不错的。此外在自己处理这样的数据时,一定要注意别分心、有耐心、有信心。有的类是比较容易弄混的(特别是疲劳的时候)。
在这个过程中不仅仅有熟练度上的巨大收获,还开启了- -些excel的处理技巧(有的是土方法)。比如自定义查找改造成了两项查找( 配合快捷键,虽然还是很笨)。研究了一下报错符号,还有自己怎么去添加预警图标(防止因为数据太多而漏掉数据)。
《开始》中我所用到的。
自动换行:防止因为格子小字多而“吞”字
合并单元格/取消单元格合并(制作学生成绩单,大项小项表头处理常用)
逆时针角度/顺时针角度/逆排/横排/旋转单元格文字
增加和减少缩进量
数字
会计格式、千位分割、百分比模式(单元格数字为文本格式或者前面有撇号不能使用)
格式
套用表格格式(浅色、中色、深色),单元格样式也是一些现成的文本
单元格 除了简单的插入和删除
还有启动保护工作表才能锁定单元格内容
编辑窗口的自动求和还有其他的函数,比如求格数等(下拉)