天软高频时序数据仓库是集数据接入、检查、处理、存储、查询、订阅、计算于一体的专业高频行情数据解决方案,具备丰富成熟的行情数据处理经验,存储成本小,访问效率高,适用于各类金融业务。
采用天软科技自主研发的技术,实现:
(1)数据接入校验:多源热备、合并择优,全方位的逻辑检查;
(2)数据压缩存储:存储规模只有源数据5%~10%;
(3)数据高效访问:是传统数据库100+倍,随着数据规模的增长,数据访问效率保持稳定;
(4)内置大量指标函数:基于行情tick数据和时序数据的统计指标,实现高效快速的计算性能;
(5)使用内置TSL语言可以直接基于TS数据仓库进行建模做数据挖掘;
(6)支撑实时行情处理,毫秒级延时;
(7)分布式计算、网格计算,成倍提升计算效率;
(8)统一的访问接口,支持实时、时点、时序数据的精准取数,支持跨市场、跨品种、跨交易日批量数据提取;
(9)多种交互接口支持各类第三方工具交互,支持跨操作系统访问;
(10)适用于实时行情订阅、历史数据回播、盘中监控、因子研发与评价、策略开发与回测、量化交易、指数开发等各类金融业务场景。
与同行业对比
天软高频时序数据仓库 | 常见时序数据库 | |
数据接入接口 | 天软提供多种数据源的成熟接口适配器,可快速实施; | 需要自行开发对接各类数据源, |
数据源格式 | 支持流格式、文件式;时间序列-截面 可对行情之外的持仓、交易等多种数据提供时序化支撑 | 仅支持时间序列或流格式等部分数据格式 ;通常只用于行情数据的处理; |
数据库表结构 | 统一抽象后结构,适用于股票、期货、期权、外汇等资产的行情数据,可适应各类金融业务的多样及多变 | 通常不同资产的存储结构各异 |
数据存储 | No-sql 索引紧缩 分布式存储 压缩存储: Level-1压缩至源数据的5%左右: 10G/天压缩至500MB/天左右。 Level-2压缩至源数据的10%左右: 40-50G/天压缩至5G上下/天, | No-sql 分布式存储 压缩存储: 仅部分支持,Level-1可压缩至源数据的10% 有的数据库并不支持压缩存储 |
行情源数据检查 | 根据行情源的特点结合业务规则,建立数据检查逻辑,确保行情截面数据、时序数据的联系和准确性 | 无 |
时序行情、多周期 | 历史行情、实时行情接入后即自动衍生秒级、分钟级、日线等高频、低频行情,支持盘中自动实时拟合分时数据 | 无——用户自行设计 |
数据访问 | 无锁高并发 | 无——用户自行设计 |
多级缓存 | 无——用户自行设计 | |
TB-PB级数据存贮和访问 | TB-PB级数据存贮和访问 | |
支撑定点访问 | ||
访问接口 | 各类资产的访问接口规范统一; 支持跨交易日、跨市场、跨品种批量访问 | 不同资产品种访问接口不统一 大多通过表查询模式; |
支持自由周期参数,突破整点周期,任意时点起向前滚动N秒、滚动N日进行统计 | 无 ——–需用户自行建模 | |
支持多种复权方式,任意时点起前后复权,仅需参数设置即可 | 无——–需用户自行建模 | |
支持时点仿真,真实模拟历史数据环境,避免未来数据陷阱,仅需参数设置即可 | 无——–需用户自行建模 | |
支持实时行情订阅、历史行情倍速回播 | 支持实时行情订阅、历史行情倍速回播 | |
效率是传统数据库的100倍以上 | 效率是传统数据库的100倍以上 | |
计算资源弹性部署 | 计算资源弹性部署 | |
支持多线程 | 支持多线程 | |
语法级并行计算支持, | 无——需用户自行设计 | |
计算引擎与函数库 | 10000+内置指标、方法函数 含数学方法、机器学习、证券指标库、组合管理方法库、归因分析方法库等 | 置函数较少 |
内置计算引擎,语法级支持,原厂配置 | 无——需对接第三方计算引擎 | |
内置缓存技术,语法级别支持,减少中间过程的计算迭代 | 需用户自行组织设计 | |
数仓与计算引擎紧耦合,无传输成本 | 与第三方计算引擎之间存在一定数据传输成本 | |
多金融业务场景支撑 | 内置策略回测、多因子回测、因子归因、事件套利、组合优化、算法交易等多种开源业务框架。 用户无需组织数据,可快速实现相关业务,细节处理仅需参数选择,结果丰富、体系健全。 用户亦可复用开发,再统计结果 | 内置业务框架少,且结果不丰富,很多需用户建模再统计 |