VizML: A Machine Learning Approach to Visualization Recommendation
Kevin Z. Hu, Michiel A. Bakker, Stephen Li, Tim Kraska, and C´esar A. Hidalgo
Introduction
之前的系统例如Data2Vis之类的,不能学习像一个分析者一样做可视化的设计选择(可解释性和可集成性),在数据集的质量和数量上有着局限性。
在这篇文章里,我们首先将可视化描述为一个最大化效用的设计选择问题,基于数据集、任务和文本。然后我们将可视化推荐表述为一个学习设计选择的模型训练问题。
Problem formulation
排列组合,子集,贪心
Data
81 single-column features
30 pairwise-column features
841 dataset-level features : 16 aggregation functions
encoding-level design choices
visualization-level design choices
Methods
乱七八糟
- 评价标准
- 集成:端到端模型
- 开发公共基准语料
- 无监督模型
- contextual factor?
- 巨多的特征