DataShot: Automatic Generation of Fact Sheets from Tabular Data
Yun Wang*, Zhida Sun*, Haidong Zhang, Weiwei Cui, Ke Xu, Xiaojuan Ma, and Dongmei Zhang
目录
Introduction
Fact sheet是一种数据、知识和信息的综合呈现,以一种简洁的格式强调大量信息中的重点。
由于表格数据被广泛使用,普遍用户更为熟悉,所以选择使用表格数据。
在这项研究中,第一个主要挑战是需要从数据表中提取数据事实,并组织这些事实成一个有意义的话题。另一个挑战是需要选择合适的、可以描述数据事实的可视化形式。
Survey on fact sheet design
The fact sheet dataset
我们选择了Kantar Information is Beautiful Awards作为数据源,然后根据数据图的类型检索了2012-2018年期间的工作,最后确定了一个包含298个信息图例子的数据集:
- 高质量数据:专家小组根据严格的评价标准授予奖项;
- 包含多样的话题和领域;
- 包含多种文化背景/语言;
- 被媒体广泛传播。
由于一些例子中包含经过设计的艺术图像或者艺术