![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
DataBase
文章平均质量分 73
糖小豆子
做一个快乐的程序员,啃一口酱猪蹄忘记所有烦恼。
展开
-
学习哈希综述:A survey on learning to hash
a survey on learning to hash翻译 2023-01-04 16:31:08 · 1012 阅读 · 0 评论 -
MySQL索引总结 MySQL Index Type
MySQL索引总结原创 2022-12-26 17:10:37 · 1005 阅读 · 0 评论 -
bitmap join index笔记
bitmap join indexbitmap indexbitmap join indexoracle bitmap join index整理一下看到的bitmap join index笔记。bitmap index针对每一个可能的值x,建立一个或一组位图映射,每个bit为1代表这个位置的值等于x,为0则不等于x。每个位置都可以直接映射到某一行的rowid。bitmap index对于并发DML的性能很差,OLTP系统并不合适使用bitmap index。从oracle9i起,oracle引进了原创 2022-05-13 20:08:11 · 390 阅读 · 0 评论 -
数据驱动基数估计:DeepDB: Learn from Data, not from Queries!
面对大规模数据和不同的应用场景,传统数据库组件存在业务类型不敏感、查询优化能力弱等问题。因此,目前一类研究通过将传统数据库组件用机器学习算法替代,来实现更高的查询和存储效率。主导的学习组件,是query-based,workload-driven,以一堆有代表性的queryset去实际运行,产生训练集。这种方式的问题,在于训练成本很高,并且当workload变化时需要不断迭代。本文是采用另一种思路,data-driven,就是直接对于数据建模,并且模型可以同态的变化,接受insert,update,del原创 2021-05-21 10:48:28 · 1196 阅读 · 4 评论 -
列索引推荐:Workload-driven recommendations for Columnstore and Rowstore indexes in relational databases.
给定工作负载,系统分析工作负载以识别并推荐一组对工作负载性能最优的行存储和列存储索引;系统扩展到数据库系统优化器的“What-if”API,在不实际构建索引的情况下估算列存索引的大小(以每个列的粒度计算),估算构建每个列存索引时将导致的查询性能改进。列存索引不同于行存储(eg. B-tree)索引,优化器只需要考虑访问查询中引用的列的成本。对于行存储索引,优化器可能只关心索引的总大小。列存储大小估计的主要挑战是,当数据库管理系统构建列存储索引时,它应用编码和压缩技术的组合,使列存储索引的大小依赖于数据原创 2021-05-18 16:17:34 · 156 阅读 · 0 评论 -
数据库行列混合论文:Columnstore and B+ tree - Are Hybrid Physical Designs Important?
Columnstore and B+ tree - Are Hybrid Physical Designs Important?HTAP混合负载是工业界的一个热点,一般来说,B+树用于OLTP业务,列存用于OLAP业务。然而,真实的业务场景中很难区分workload到底是OLTP还是OLAP,主流的OLTP商业数据库都会有比较强的OLAP分析能力。这篇论文研究如何在同一个数据库中混合使用B+树和列存这两种不同类型的索引,它首先通过一个benchmark对这两种索引在各种读写场景下的性能做了一个量化对比,接翻译 2021-04-29 17:40:28 · 736 阅读 · 0 评论 -
使用Anaconda安装faiss
我透,耗费了我两个下午,在第一台服务器安装踩坑,后来又在另一台服务器安装又踩坑,我服了。特此记录。使用Anaconda安装faiss是最方便快速的方式,facebook会及时推出faiss的新版本conda安装包,在conda安装时会自行安装所需的libgcc, mkl, numpy模块。faiss的cpu版本目前仅支持Linux和MacOS操作系统,gpu版本提供可在Linux操作系统下用C...原创 2020-04-06 16:21:25 · 4936 阅读 · 3 评论