在大数据处理的时候总是会有说,现今科学技术的发展使得我们使用样本取代总体的时代过去了。在新的时代我们使用的是足够多的接近于总体的大的数据。在这个大的数据里面,我们没有办法具体数据具体的分析。因为它足够的大。
因此引入了相关性的概念,我们不在试图任何事情都有一个确定的因果关系,更加关注与彼此之间的相关性。
例如不在寻求为什么啤酒和尿布要在一起搭配的深层的原因,而是根据商业的营销过程中数据的统计呈现的相关性的信息去解释这个问题。
因此,相关性的研究是很重要的一部分,而问题的关键就是怎样把相关性引入到需要的地方去。于我而言就是怎样的引入到自己研究报告中。