回顾
几个月前写了一篇文章,关于 C#写的NoSQL开源项目/系统(系列),看过该文章的同学,估计会对.NET能实现高效的NoSQL是有信心的。几个月过去了,有了新进展。
STSdb是什么
再来说明一下STSdb是什么:STSdb是C#写的开源嵌入式数据库和虚拟文件系统,支持实时索引,性能是同类产品的几倍到几十倍,访问官方网站。
特性
- 支持几十亿级别的数据存取
- 支持TB级别文件大小
- 实时索引
- 内置压缩
- 内置序列化
- 支持稀疏分散的文件(byte[])
为什么?
数据库的共同点
每个数据库都有一个共同点,就是受限于索引结构,因此每当改进了索引数据结构,性能也随之大增。
性能瓶颈
在数据库系统中,每当对数据进行索引,数据的逻辑位置会被映射到物理设备,这个映射严重依赖设备的寻址时间。
解决办法
当遇到性能瓶颈时:
办法就是,不对每个操作都进行一次寻址,而是每次寻址都做多个操作。
解决方案-WATERFALLTREE™ (瀑布树)
STSdb 4.0突破性地发现并实现了Waterfall-tree (瀑布树)树结构。Waterfall-tree是注册商标,并且拥有专利。与传统的B+树类似,但B+树是同步操作,而瀑布树是分组异步操作。
现有的解决方案有一个共同的缺点:当索引随机主键的时候,I/O性能不高(退化严重)。
而STSdb4.0的瀑布树带了来前所未有的性能提升。
下图直观地展示了瀑布树的原理:
性能比较
数据库 | 存储设计 |
---|---|
Amazon Dynamo DB | Zero-Hop Distributed Hash Table |
Cassandra | Memtable / SSTable |
Couch DB | Append-only B-tree |
Db4objects | B-tree |
Google Big Table | SSTable (log-structured storage) |
H base | Memtable / SSTable on HDFS |
Level DB | LSM-tree |
Memcached | Memory caching |
Mongo DB | B-tree |
Oracle Berkeley DB | B+-tree |
Perst | B-tree/T-tree/R-tree/Patricia trie/KD-tree |
Redis | In-memory only with background snapshots |
Scalaris | In-memory only |
Tokyo Cabinet | Hash or B-tree |
随机写
随机读
顺序写
顺序读
这个性能,只能用凶残来形容啊!
应用领域
Hello STSdb
打开数据库并写入数据
using
(StorageEngine engine =
new
StorageEngine(
"stsdb4.sys"
,
"stsdb4.dat"
))
{
XIndex<
int
,
string
> table = engine.OpenXIndex<
int
,
string
>(
"table"
);
for
(
int
i = 0; i < 1000000; i++)
{
table[i] = i.ToString();
}
table.Flush();
engine.Commit();
}
|
读取数据
using
(StorageEngine engine =
new
StorageEngine(
"stsdb4.sys"
,
"stsdb4.dat"
))
{
XIndex<
int
,
string
> table = engine.OpenXIndex<
int
,
string
>(
"table"
);
foreach
(var row
in
table)
//table.Forward(), table.Backward()
{
Console.WriteLine(
"{0} {1}"
, row.Key, row.Value);
}
}
|
更多例子
可以访问这里查看更多的例子,或者下载类库或代码,里面有pdf文档。
许可
尽管STSdb在官网没有说明许可,但从老版本的开源项目托管网站来看,许可是GPL 2.0+。