ShapeSearch: A Flexible and Efficient System for Shape-based Exploration of Trendlines (sigmod 2020)
在数据探索过程中,确定具有所需模式的趋势线可视化是一项常见任务。现有的可视化分析工具为这类任务提供了有限的灵活性、表达性和可伸缩性,特别是当感兴趣的模式没有得到充分指定和近似时。
我们提出ShapeSearch,一个高效和灵活的模式搜索工具,它可以通过多种机制搜索所需的模式:草图,自然语言和视觉正则表达式。我们开发了一种新的形状查询代数,具有最小的原语和操作符集,可以表达各种形状搜索查询,并设计了一个自然语言和基于正则表达式的解析器,将用户查询转换为代数表示。为了在交互响应时间内执行这些查询,ShapeSearch使用快速形状代数执行引擎,该引擎具有查询感知优化和感知评分方法。我们对该系统进行了全面的评估,包括用户研究,涉及基因组数据分析的案例研究,以及性能实验,与最先进的趋势线形状匹配方法进行比较-这些方法共同展示了ShapeSearch的可用性和可扩展性。