论文笔记——How to ConQueR Why-Not Questions

How to ConQueR Why-Not Questions

Quoc Trung Tran and Chee-Yong Chan

 

Background

数据库查询时,常常出现一些非用户预期的结果。如果系统提供:1why操作(为什么某一些结果会出现?)2why not操作(为什么某些结果没有出现)这两种操作,为用户解释查询结果,就能消除用户的疑惑,也能更好地帮助用户改进查询语句。

 

Related Work

1.  Why操作

一般的数据源工具就能解释。

         2Why not操作

                  主要有2种模型:

1)  找出有罪的操作(culprit):某个导致用户期待的结果被排除的操作。

2)  如果数据源不可靠,则改进数据,使得用户期待的结果出现。

本文针对why not操作。

 

Contributions

         提出了一种自动改进查询语句的机制(refined query),使得新查询语句的查询结果即包括原始的查询结果,也包括丢失的结果(missing),同时将无关的结果降低到最小。

 

 

Overview

         本文研究的query,其投影操作(project)包括两种:

1)  属性值

2)  聚集操作(countsumavg

投影操作不涉及运算表达式

 

主要的query分为2:

1)  基本的select-project-join(SPJ) query

2)  SPJ query with aggregation(SPJA)

基本的SPJ select中增加聚集操作,或者增加group-by操作

 

 

符号表

D

Database

数据库

Q

Input query

查询

QD

Output of Q on D

查询结果

S={t1,,tn}

Why not tuples on Q(D)

SQD=

S

Missing的结果集

(S, C)

why not question on Q(D)

C is a (possible emty) set of

Selection conditions defined on the variables appearing in S

C是选择变量的集合

EgS={Alice,$x,(Bob, $y)}

And C={$x>$y}

 

Q’

Refined query

1)Q(D) Q’(D)

2)S Q’(D) , 且满足C的要求

 

relQ

From后的shema集合

 

Proj (Q)

Select操作中selection属性的集合

 

Sel (Q)

Where操作中谓词的集合

 

Join(Q)

Where操作中join谓词的集合

 

 

 

比较refined queries的矩阵

         生成多个改进的query,要进行比较,找出最好的。

 

1)  Dissimilarity metric 相异性矩阵

Q变为Q’edit distance (from where语句)

Edit distance越小,Q’Q越相似,能够较好地保持原信息,

也能提示user如何去修改query

 

Edit operation分为4中,代价不同

(1)       修改谓词常量,代价w1=1

(2)       增加select操作,w2=3

(3)       增加/删减joinw3=5

(4)       增加、删减 表,w4=7

 

最终代价表示为:

,其中ni代表操作i的个数,wi代表操作i的代价

2)  Imprecision metric不精准性矩阵

无关元组个数:|Q’(D) – Q(D) –R|

其中,R=S  Q’(D)

 

 

Refined Q1 Q2好的标准:

1)  DM1=DM2, IM1<=IM2

2)  等号最多只能取一次

 

 

 

ConQueR包括2部分:

1ConQueRS

         生成refined query,找到最similarquery

2ConQueRP

         1基础上,增加谓词,提高准确度

 

 

 

 

 

 


SPJ的处理过程

1ConQueRS

        

2ConQueRP

 

 

 

SPJA的处理过程

Why not question分为2

1)  why ti.Aagg = some value Ki,

2)  涉及》=2why not tuplest1,t2(existing/missing tuple)

t1.Aaggt2.Aagg的关系

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值