![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文翻译
文章平均质量分 79
糖小豆子
做一个快乐的程序员,啃一口酱猪蹄忘记所有烦恼。
展开
-
学习哈希综述:A survey on learning to hash
a survey on learning to hash翻译 2023-01-04 16:31:08 · 1012 阅读 · 0 评论 -
查询聚集:congressional samples for approximate answering of group-by queries
congressional samples for approximate answering of group-by queries翻译 2022-12-20 20:32:16 · 123 阅读 · 1 评论 -
子图同构论文:Efficient Streaming Subgraph Isomorphism with Graph Neural Networks
Efficient Streaming Subgraph Isomorphism with Graph Neural Networksvldb 2021 research track图神经网络的有效流子图同构Abstract在基于图的数据管理中,检测同构子图的查询是很有重要的。当对单个或批量查询的静态设置,子图同构搜索问题得到了相当多的关注,但现有方法不能扩展到连续查询流的动态设置。在本文中,我们通过缓存和重用以前的结果来解决由子图同构查询流引起的可伸缩性挑战。首先,我们提出一种新的基于图嵌入的子图翻译 2021-10-18 14:44:39 · 998 阅读 · 0 评论 -
数据驱动基数估计:DeepDB: Learn from Data, not from Queries!
面对大规模数据和不同的应用场景,传统数据库组件存在业务类型不敏感、查询优化能力弱等问题。因此,目前一类研究通过将传统数据库组件用机器学习算法替代,来实现更高的查询和存储效率。主导的学习组件,是query-based,workload-driven,以一堆有代表性的queryset去实际运行,产生训练集。这种方式的问题,在于训练成本很高,并且当workload变化时需要不断迭代。本文是采用另一种思路,data-driven,就是直接对于数据建模,并且模型可以同态的变化,接受insert,update,del原创 2021-05-21 10:48:28 · 1196 阅读 · 4 评论 -
列索引推荐:Workload-driven recommendations for Columnstore and Rowstore indexes in relational databases.
给定工作负载,系统分析工作负载以识别并推荐一组对工作负载性能最优的行存储和列存储索引;系统扩展到数据库系统优化器的“What-if”API,在不实际构建索引的情况下估算列存索引的大小(以每个列的粒度计算),估算构建每个列存索引时将导致的查询性能改进。列存索引不同于行存储(eg. B-tree)索引,优化器只需要考虑访问查询中引用的列的成本。对于行存储索引,优化器可能只关心索引的总大小。列存储大小估计的主要挑战是,当数据库管理系统构建列存储索引时,它应用编码和压缩技术的组合,使列存储索引的大小依赖于数据原创 2021-05-18 16:17:34 · 156 阅读 · 0 评论 -
结构数据:ARM-Net: Adaptive Relation Modeling Network for Structured Data
ARM-Net: Adaptive Relation Modeling Network for Structured DataSIGMOD ’21 comp.nus.edu.sgABSTRACT关系数据库是存储和查询结构化数据的标准,从结构化数据中提取见解需要高级的分析。深度神经网络(DNNs)已经在特定的数据类型(如图像)中实现了超人类的预测性能。然而,现有的DNN在应用于结构化数据时可能不会产生有意义的结果。原因是表中属性值的组合之间存在关联和依赖关系,而这些关联和依赖关系不遵循简单的可被DNN翻译 2021-05-12 15:12:08 · 572 阅读 · 2 评论 -
数据库行列混合论文:Columnstore and B+ tree - Are Hybrid Physical Designs Important?
Columnstore and B+ tree - Are Hybrid Physical Designs Important?HTAP混合负载是工业界的一个热点,一般来说,B+树用于OLTP业务,列存用于OLAP业务。然而,真实的业务场景中很难区分workload到底是OLTP还是OLAP,主流的OLTP商业数据库都会有比较强的OLAP分析能力。这篇论文研究如何在同一个数据库中混合使用B+树和列存这两种不同类型的索引,它首先通过一个benchmark对这两种索引在各种读写场景下的性能做了一个量化对比,接翻译 2021-04-29 17:40:28 · 736 阅读 · 0 评论