文 / Michael Young,Nick Bilton 译 / 祝洪凯,李妹芳 你是否曾经想过《纽约时报》网站的读者会涵盖什么类型的人?我们想过。我们还在想他们倾向于在一天之中的什么时候来访问网站,使用什么工具访问以及他们都来自哪里?从他们是谁到在什么时候、以什么方式以及为什么等,所有这些问题都在我们的思考范围之内。 本文将要介绍的这个可视化项目源于在《纽约时报》研发试验室一次午餐时就这个话题开展的一次简单讨论。正如你将看到的,从非常简单的基于地理的数据集合开始,很快就深入到海量数据和潜在可视化。最终,我们创建了一个可视化用于显示每天《纽约时报》Web站点和手机站点在世界和美国的流量。
收集一些数据 为了对Web站点和手机站点24小时的流量进行可视化,我们需要创建一个可以从《纽约时报》的访问日志中抽取和清洗数据的程序。考虑到我们想要创建一个可以显示在一天内网站的访问次数的可视化并且是一个基于地理信息进行展示的可视化,我们需要的数据包括:
- 在24小时内,用户每次访问Web站点或手机站点的时间戳。
- 每个用户每次访问时所处位置的经度和纬度。
- 世界地图的Web站点和手机站点的数据。
- 美国地图的Web站点和手机站点的数据。
- 世界地图和美国地图的Web站点的数据。
- 世界地图和美国地图的手机站点数据。