最近一直忙去年的一个项目,东西其实都是现成的,没什么特殊的技术含量。但是麻烦的是,相关的数据处理,以及应付基层操作人员没完没了的问题。
在这个过程中,我发现,其实对于一般的操作者而言,需要的不一定是多么华丽的系统界面,或者多么强大的功能。需要的仅仅是,简单易学的操作,以及容错功能(就是别管我怎么弄,系统都不会突然的崩溃)。
一般的数据采集,一般的操作者,尤其是政府部分,更习惯使用微软公司的Excel。这个东西简单、使用方便,但是同时也给我们技术人员带来很大的麻烦,就是后期的数据处理,Excel数据录入要求过低,没有统一、固定的格式要求,因此数据导入非常困难。如果采集的数据再是文本格式,那么还要继续导入到Excel或者数据库中,这个过程就会造成数据格式的变化,造成数据缺失。通过,一系列的摸索,我总结以下几点,整理如下,希望和大家分享。
1、txt(或者csv)格式数据导入Excel
一般的csv文件可以用Excel直接打开,如果数据中有数字组成的长字符串,导入后就会发现,全部变成了科学技术法,从而影响到正常显示。用以下方法导入,可以解决上述问题。
(1)打开一个空Excel表。选择“打开”,文件类型选择“文本格式文件(.txt,.csv)”,选择需要打开的文本文件名。确定
(2)进入“文本导入向导”对话框,选择文件分割类型,下一步
(3)选择数据分隔符,下一步
(4)列数据格式设置,这步非常关键,如果选择不正确,就会出现前面讲到的问题。建议数字组成长字符串,设置为“文本”格式。一列列设置。最后,选择“完成”。
这样导入的数据不会出现数据缺失、数据类型转换错误等问题了。
2、Excel导入Access,都是微软的产品,其实和Excel导入差不多,也要设置格式。只不过最初是新建一个数据库,选择的是“导入外部数据”。如果选择“打开”,那么最后看到的只是个Excel表连接,不会是数据导入,生成新表。
3、Excel导入Sql Server等大型数据库,最简单的办法,通过数据导入就可以完成了。
嗯,暂时遇到的就是这些,先写到这,以后有补充,再后续添加。数据处理是个复杂的过程,个人认为,切不可图一时方便,在数据采集时,过分依赖Excel,这样真的会给你后面的工作,带来无穷无尽的困难和麻烦的。