【DB&AI】论文笔记整理

Survey & Tutorial

【2020-11】基于机器学习的数据库技术综述
文章思维导图

Index Optimization

【2020-06】Hands-off Model Integration in Spatial Index Structures

Query Optimization / Cardinality Estimation

【2018-12】Learned Cardinalities: Estimating Correlated Joins with Deep Learning

【2019-06】An End-to-End Learning-based Cost Estimator
模型结构
作者提出了一种基于学习的数据库查询代价估计器,分为3个部分:
1)训练数据生成。首先自动根据工作区中已有的数据和谓词生成大量可能的查询,而后计算得到这些物理查询计划的实际基数和成本,生成训练样本,格式为三元组 <物理查询计划,计划的实际成本,计划的实际基数> 。
2)特征提取。从查询计划中提取出各种有效的成分(谓词、名称、操作等)进行编码。
3)树结构模型。依靠所给的训练集进行学习,更新自身参数,最终得到能够同时进行成本估计和基数估计的模型。

Learned DBMSs

【2019-09】DeepDB: Learn from Data, not from Queries!

Autonomous DB

【2021-10】From Natural Language Processing to Neural Databases

Database Diagnosis

【2020-04】Diagnosing Root Causes of Intermittent Slow Queries in Cloud Databases
本文主要对云数据库中出现间歇性慢查询的根本原因进行分析 (Root Causes Analysis, RCA) ,并提出了诊断方法。

Database Design

【2020-07】Buffer Pool Aware Query Scheduling via Deep Reinforcement Learning
作者认为可以通过降低查询访问磁盘的次数,也就是提高缓存命中率 (buffer hit rate) 的方法,来提高查询调度 (query scheduling) 的性能。作者提出了名为SmartQueue的调度器,它可以利用输入查询中的重叠信息,依靠深度强化学习方法找到最优的查询调度策略。
SmartQueue模型结构图
【2020-08】Spitz: A Verifiable Database System
可验证的数据库 (Verifiable Database, VDB)

【2021-09】ML Based Lineage in Databases

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值