LineSmooth: An Analytical Framework for Evaluating the Effectiveness of Smoothing Techniques on Line Charts
前言
当数据too noisy时,折线图看起来就会太混乱,而Smoothing可以reduce the visual cluster。Smoothing 的方法众多,作者发现没有研究工作来对各种Smoothing方法的效果进行对比和评估。于是,作者就提出了一个分析框架,该框架用于评估不同方法对LineCharts 进行Smooth的效果。
可视化设计者可以利用这个框架:
(1)select a smoothing technique, which is most effective in general or most effective for the tasks their users perform;
(2) evaluate their data to select the technique that is specifically
most effective;
(3) to understand how much error is introduced
as they increase the level of smoothing used in their visualizations.
一、TAXONOMY OF LINE CHART SMOOTHING APPROACHES
论文将smoothing approaches分成了4类(Rank Filters、Convolutional Filters、Frequency Domain Filters、Subsampling),每类包含3种方法,每种方法的执行具体见论文。
二、ANALYTICAL FRAMEWORK FOR MEASURING FOR SMOOTHING EFFICACY IN LINE CHARTS
1.Measures of Effectiveness
这部分主要是提出了8个metrics,每一个metric都可以用来衡量the quality of smoothing results.其实,这些metrics大都是将input_data 和 output_data做些相减求和运算。
2.Low-Level Task Taxonomy for Line Charts
根据人们对Line Charts的常见用途,作者提出了8个tasks。例如:找Line Chart 中的极值点和异常点等。
3.Evaluation Framework
有了metrics和tasks,接着就要就要建立评估框架了。
这里还需要做两件事:
第一:对Smoothing Level进行度量的方法。作者引用了别人的工作,通过计算ApEx来衡量Smooth Level,ApEx值越小说明Line Chart 越可读方法。解释详见:https://github.com/cudbg/pae 。
第二:A method for ranking the efficacy of methods, using a specific metric.
其中Ranking包括:
(1) Ranking a Single Smoothing Level(对结果进行简单排序即可,某种smoothing方法通过某个metric计算出的值越小,说明该方法越好)
(2) Ranking All Smoothing Levels(横坐标是ApEx,纵坐标是通过某个metric计算的值,通过计算积分来评估smoothing方法的好坏,积分值越小,说明该方法越好)
(3) Ranking Across Multiple Datasets(在多个数据集上进行smoothing方法的对比评估)
思考
这篇文章的思路和算法其实挺简单的,制定一个分析框架,用户根据自己的任务需求通过这个分析框架来选择合适Smoothing method. 我在了解一些散点图采样的文章(汪的递归划分、胡老师Z-Order、随机采样、陈为的蓝色噪声),我想能不能仿造这篇文章做一个散点图采样方法的对比评估。