数据思维-序

数据是对客观世界的一种反映,它和我们眼见之物和所听之物并无本质上的不同,只不过其拥有更加简洁与直观的形式,正是具有这样的性质,数据可以更加直观地反映客观世界。
数据的形式有很多,依据规范的程度不同,可划分为结构化的数据、半结构化的数据和非结构化的数据,所谓的结构化的数据是以记录的形式存在的。在现代,很多人十分重视结构化数据,都致力于将非结构化与半结构化的数据转化成结构化的数据,如自然语言处理等,然而无论是结构化的数据,还是非结构化的数据都有其存在的道理,它们都是对客观世界的反映,只要善加利用,我们都可从其中窥探世界真实的奥妙。有时非结构化的数据更有助于我们获取更真实的信息。
数据的来源有许多,从前大多数据都是人眼所见或是人耳所听,而今随着产业革命的不断推进,机器检测也逐渐成为了数据的重要来源。然而数据毕竟只是一种反映,并不能代表最真实的世界,所以人们去认识了解这个世界是有主观因素影响的。
数据是研究世界的优秀工具与途径,但是如果没有正确的应用方向,数据就不会发挥其应有的作用,所以我们必须掌握数据的应用途径。大体上数据的应用有五种:一是数据实验,即通过小规模调查的方法看项目是否能够到达预期的目的;二是数据评估,即利用数据评估项目实施后的效果;三是数据预测,即利用部分数据去预测未知的数据;四是数据诊断,即分析数据变化后的原因;五是数据监测,即对某个对象进行全方位长时间的量化观察。
人们通过数据去认识世界,总的来说有四重障碍,从而导致产生虚假的认知。第一重是对所研究对象的操作化定义的偏离,也就是说我们不能够对我们所想研究的问题进行一个很好的概括,且所需要搜集的数据并不能很好地满足研究的需要;第二重是获取数据时的偏离,我们在获取数据时会因为当事人研究人员或是机器的灵敏度或是搜集方法错误等原因而造成数据的不准确,从而让数据失真;第三重是对数据使用的统计方法造成的偏离,统计方法的本质是对数据进行简化,而在简化的过程中就会丢失部分真实信息;第四重是利用自身的知识利用数据判断而产生的偏离,由于研究人员的知识储备、环境等因素的限制,利用数据产生的决策就会出现偏差。由以上四点可见,数据并非万能,如果将以上四点控制好,那么数据就是帮助我们研究以及认识世界的优秀工具,如果做不到将四重障碍的影响减小,那数据很有可能是无用的,甚至是有害的。这将提醒我们,数据是一把双刃剑,我们应该不止从数据一个方面进行决策,而是通过将数据与经验、理论等结合起来形成多元的决策模式,使其彼此相互映照,降低出现错误的风险。
本文所讲述的数据思维旨在帮助人们如何更好地去应用数据以及如何去防范数据产生的风险,因为是从正反两面去考量数据,所以本人将其称为辩证的数据分析思维。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值