- 博客(11)
- 收藏
- 关注
原创 Uncertain Databases and Probabilistic Queries
传统数据库很难处理Data uncertainty, imprecision, noise, missing values这些数据性质,比如科学研究中数据是有误差的。我们需要不确定数据库。
2025-05-07 14:14:15
637
原创 文本数据库的相关请求及实现技术
(文本数据库):a collection of documents(文档):a list of words以下很多都只针对stem(词根)
2025-04-20 23:20:06
1022
原创 Top-k问题————TA, NRA, LARA算法
就是当前有大量数据,每条数据有一个或多个attribute,有一个针对这些变量的aggregate function f,函数output就是combined score,找到score最高或最低的前k个数据。最简单的例子就是一堆商品信息,找到最贵的2个商品。
2025-04-19 16:38:38
636
原创 Query Optimisation in RDBMS
提早selection到nested loop的inner loop中并不会节省I/O,因为你不会存selection后的全部结果,只是每次取出reverses的一部分selection,但你join的时候对sailors的下一page匹配时,要从reverses从头开始扫描,重新从硬盘中取到原始数据,重新selection,不会减少I/O。,每一次4 buffers存outer表,1 buffer存inner表,一次遍历inner表同时匹配4 buffers outer表的数据,减少遍历次数。
2025-04-16 02:13:19
648
2
原创 欧拉图问题(Euler Graph)
欧拉通路(Euler path or Euler tour):我们从有向图或者无向图中的任意一点出发,将所有的边遍历且仅遍历一次的通路序列我们称之为是欧拉通路,点可多次遍历欧拉回路(Euler circuit):如果我们的欧拉通路的起点和终点是一样的我们称之为欧拉回路欧拉图(Euler graph):具有欧拉回路的图称之为欧拉图,规定只有一个顶点的空图属于欧拉图半欧拉图:只具有欧拉通路的图我们称之为是半欧拉图1.定理:①无向图G是欧拉图的充分必要条件是:G是连通图并且没有奇数度顶点必要性:图G是
2021-12-09 20:11:35
6787
原创 最小生成树(Minimum Spanning Tree)与最小树形图(Minimum Arborescence)问题
生成树:给图中指定一个特殊的点root,选择图中部分已有边生成一棵以root为根的生成树T。最小生成树:在无向图中生成一棵树,含有的边的总权值要求是所有可能生成树中最小的,该树不唯一。最小树形图:有向图中的最小生成树,同样不唯一。1、最小生成树(无向图)Prim算法最小生成树Prim算法理解Kruskal算法最小生成树之Kruskal算法2、最小树形图(有向图)挺复杂的,还没整理...
2021-11-26 15:00:08
1366
原创 图的最短路径问题(Shortest Path)
1、深度或广度优先搜索算法(解决单源最短路径)该方法通过DFS或BFS暴力遍历获取一顶点到目标顶点的路径,一一比对各路径的权值和来获取最短路径2、Dijkstra算法(解决单源最短路径)最短路径问题—Dijkstra算法详解Dijkstra(迪杰斯特拉)算法是典型的单源最短路径算法,用于计算一个节点到其他所有节点的最短路径。主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止,相对于暴力简单的Floyd算法,Dijkstra算法更为有用且时间复杂度较为合理–O(N^2)。注意该算法要求图中不存在
2021-11-21 23:48:20
1379
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人