数据也会说谎：常见的数据造假三种形态！

最新推荐文章于 2024-04-15 20:04:00 发布

liu94457

最新推荐文章于 2024-04-15 20:04:00 发布

阅读量2.5k

点赞数

分类专栏：诸葛io app运营诸葛sdk 诸葛数据运营行为洞察精细化运营文章标签： app数据运营数据运营精细化运营诸葛诸葛IO

数据运营同时被 3 个专栏收录

145 篇文章 0 订阅

订阅专栏

140 篇文章 0 订阅

订阅专栏

132 篇文章 0 订阅

订阅专栏

日常生活工作中，处处都会与数据打交道，但你知道数据是会“说谎”的，即你看到的数据结果并不是事实。本文介绍一些常见的说谎场景以及如何避免。

一、图表欺骗

图表通常用来增强需要文字和数据的说服力，通过可视化的图表更容易让受众接受信息。但图表有时候会表现的不是数据的本质:

1.图表拉伸

如果没有特殊用途，通常图表的长(横轴)与高(纵轴)的比例为1:1到1:2之间，如果在这个范围之外，数据现实的结果会过于异常。比如:

2.坐标轴特殊处理

在很多场合下，如果两列数据的取值范围差异性过大，通常在显示时会取对数，这时原来柱状图间的巨大差异会被故意缩小。通常，严谨的分析师在讲解之前会进行告知。比如:

3.数据标准化

数据标准化也是一个让数据落在相同区间内常用的方法，常用Z标准化或0-1标准化，如果不提前告知，可能会误以为两列数据取值异常接近，不符合实际业务场景，比如:

150602095039-5Z2-4

隐秘层次:★★☆☆☆
破解方法:询问分析师的图表各个含义，了解基本图表查看常识。

二、数据处理欺骗

数据处理中的欺骗方法通常包括抽样方法欺骗、样本量不同、异常值处理欺骗等。

1.抽样方法欺骗

整体样本的维度，粒度和取数逻辑相同的情况下，不用的样本抽样规则会使数据看来更符合或不符合“预期”。比如在做用户挽回中，假如做的两次活动的抽样样本分别是最近6个月未购物和最近6个月未购物但有登陆行为的用户，不用做什么测试，基本上可以确定后者的挽回效果更佳。要识破这个“骗局”只需要询问数据取样方法即可，需要细到具体的SQL逻辑。

2.样本量不同

严格来说样本量不同并不一定是故意欺骗，实践中确实存在这种情况。(遇到这种情况可以用欠抽样和过抽样进行样本平衡)样本量不同分为两种情况:

样本量数量不同。比如要做效果差异对比，第一步是做效果比对，假如两个数据样本量分别是几千和几万的级别，可比性就很小。尤其是对于样本分布不均的情况下，数据结果可信度低。

样本主体不同。这是非常严重的数据引导错误，通常存在于为了达到某种结果而故意选择对结果有利的样本。比如做品类推广，一部分用户推广渠道为广告，另一部分是CPS可以遇见相同费用下后者的效果必然更好。

相同样本不同的客观环境。比如做站内用户体验分析，除了用随机A/B测试以外，其他所有测试方法都没有完全相同的客观环境，因此即使选的是相同样本，不同时间由于用户，网站本身等影响，可信度较低。

3.异常值处理欺骗

通常面对样本时需要做整体数据观察，以确认样本数量、均值、极值、方差、标准差以及数据范围等。其中的极值很可能是异常值，此时如何处理异常值会直接影响数据结果。比如某天的销售数据中，可能存在异常下单或行单，导致品类销售额和转化率异常高。如果忽视该情况，结论就是利好的，但实际并非如此。通常我们会把异常值拿出来，单独做文字说明，甚至会说明没有异常值下的真实情况。

隐秘层次:★★★☆☆

破解方法:在跟数据分析师沟通中，多询问他们在数据选取规则，处理方法上的方法，如果他们吞吞吐吐或答不上来，那很有可能是故意为之。同时，业务人员也要增强基本数据意识，不能被这种不可见的底层错误欺骗。

三、意识上的欺骗

这种欺骗是等级最高也是最严重的欺骗和错误，通常存在于数据分析师在做数据之前就已经下结论，分析过程中只选取有利于证明其论断的方法和材料，因此会在从数据选择，处理，数据表现等各个方面进行事实上的扭曲，是严重的误导行为！数据分析师需要有中立的立场，客观的态度，任何有立场的分析师的结论都会失之偏颇。

隐秘层次:★★★★★

破解方法:在跟该分析师沟通中，查看其是否有明显立场或态度，如果有，那么该警惕；然后通过上面的方法逐一验证。

综上，当你遇到以下数据情形，就需要警惕数据的真实性了:

数据报告从来不注明数据出处，数据时间，数据取样规则，数据取得方法等。现在市场上很多报告都属于这一类。

数据报告在做市场调研中说明全样本共1000，其中北京可能只有100，基于这100个样本出来的结论显然不可信。事实上很多市场研究报告就是这样出来的。

数据报告中存在明显的观点，对于事物的分析只讲其优势或劣势，不全面也不客观。现在很多互联网分析师就是属于这类，大家注意辨别。

诸葛IO是37degree（北京乐享天下科技有限公司）2015年2月推出的是一款基于用户洞察的精细化运营管理工具,以用户跟踪技术和简单易用的集成开发方法，助力移动应用的运营者们挖掘用户的真实行为与属性。

http://zhugeio.com/news/?p=530

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

liu94457 CSDN认证博客专家 CSDN认证企业博客

码龄10年

62: 原创

19万+: 周排名

193万+: 总排名

14万+: 访问

: 等级

2092: 积分

25: 粉丝

7: 获赞

1: 评论

36: 收藏

私信

关注

热门文章

分类专栏

诸葛io 140篇
诸葛sdk 126篇
数据运营 145篇
诸葛 132篇
数据yunying 4篇
精细化运营 114篇
app运营 111篇
行为洞察 86篇

最新评论

诸葛io教你如何做好用户画像
howell92: 数位云开发者平台，面向行业开发者赋能采集、定位等基础能力，支持安卓、iOS、小程序等不同平台，帮助行业缩短开发周期，节省开发成本，以更高效的方式获取领先的精准室内位置识别能力。目前，数位定位+采集能力已经为本地生活、新闻资讯、视频娱乐、电商母婴、考勤办公等诸多领域的服务类、工具类、娱乐类APP提供服务，赋能人员管理、定位打卡、用户画像、场景服务、数据分析、精细化运营等多种能力，打造从采集到定位，从定位到场景服务，从服务到数据分析的一整套位置服务系统。大家可以直接接入试试~ https://cloud.papakaka.com/flash/#/dashboard

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。