做数据处理要遵守的一些规则

  1. 不造锤子; 不论是FME还是Python,又或者是SQL。这些工具都很好用,在进行数据处理的时候,应当思考如何合理的使用他们。通过工具的组合,绝大多数问题都能得到解决。就像使用生活中的工具,单纯的使用一把锤子,是造不出汽车的。为了造出复杂的机械,需要的是合理的使用工具,在这过程中,可能需要使用到一些比锤子更加高级的机械等一系列工具。如果目的是造汽车,那么这些高级工具是怎么造出来的,就不是最该关注的点。造汽车的人,只需要使用好这些工具就好了。 不造锤子,并不意味着思想上的懈怠。相反的,不造锤子意味着作为一个数据处理人员要去了解各种工具,在了解的基础上思考如何对这些工具进行组合使用。只有集各家之长,才能在数据处理中做到游刃有余。像现在的我,拿FME来做日常的数据处理,Python偶尔打打辅助,ArcGIS作为日常数据处理中的最后杀手锏来搞定最后的工作。要用好这些工具,意味着对FME的几百个转换器要非常熟悉,对ArcGIS的上千个地理处理工具要做到基本的了解,Python也要写的顺溜,这样才能把它们联合起来使用。 但是通过一段时间的学习与了解,我发现SQL也可以用来做一些数据处理,但SQL虽然功能强大却没有FME的界面友好。SQL写的工具适合放在后台中,方便部署,响应快速。 无论使用什么,主要精力应该放在解决问题上,避免造锤子(轮子),尤其是重复的轮子!
  2. 保持清晰的思路 无论做什么事情,思路都是非常重要的。保持冷静的思考,是解决问题最重要的因素。 就数据处理而言,绝大多数时候,我们处理的都是小数据,与大数据相比,小数据的特点就是,杂乱、非结构化,甚至完全没有规则。针对这种数据,手动处理有时候是更好的选择。如果FME也好,Python也罢,这些工具适合的是大规模批量的数据处理与分析。打个矢量化的比方来说吧,如果选择用FME或者Python,用户输入点的坐标,然后经过处理生成矢量数据也不是不可以,但我们可以直接选择使用ArcGIS的交互式编辑来完成这这样的工作。 总之,选择合适的工具,节省自己的时间。让自己熟悉的工具各司其职!
  3. 单个工具尽量简单 刚学FME的时候,模板做的都比较简单,小小的,可能也就三五个转换器。慢慢的,随着对FME的了解,能用FME做的事情也是越来越多,模板动辄上百个转换器,再加上写模板的时候没有注释,排版乱七八糟……这样做的后果就是容易迷失在为了写模板而写模板中。所以,我觉得,无论写什么工具,FME或Python,都应该尽量的精简,一个模板或者函数/类中尽量少包含一些内容。对常用的功能进行剥离,写成自定义转换器或者是包。总之,模板或类应该体现出思路、尽量精简。尽量避免混乱的思路!按照金字塔原理中指出的那样,每个模板,不超过7个子功能模块,最好是3-5个小小的子模块。 总之,要尽量简单!简洁,就是美

from 做数据处理要遵守的一些规则

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值