还在手动的将数据在不同的存储中存来存去?
海量数据中查找某数据耗时耗力?
分析数据过程中内存超配,机器宕机?
......
如果上述问题还在占用您的时间和精力,说明您的生物信息分析系统亟待更新完善。一个好的生物信息分析系统,可以解放您的双手,您只需专注科学研究,其他问题交由生物信息分析系统来做。
生物信息分析系统并不是简单的硬件存储加上分析软件的堆叠,而是为满足生物信息分析对于速度、规模和智能化等苛刻需求建立的一体化解决方案。荣之联为生物信息专门设计了自底向上的完整的数据系统——荣之联BioStack私有云,可一次性解决生物信息数据的存储、数据管理、分析计算和特征数据挖掘。是高度垂直的、全栈的、更专业的生物信息分析系统。
- 存管算察 四位一体 -
数据存储—理解生物信息应用,极致性能优化;
随着分析算法和工具的不断丰富,不同分析阶段访问数据的模式也越来越多样化,对于存储的带宽、IOPS 和延迟等性能指标都有不同的需求,所以无法通过单⼀的存储系统来解决生物信息分析面对的所有问题。针对不同的需求我们推出多套不同存储系统组合在一起来解决生物信息不同分析模式要求的带宽和IOPS的性能。
不同存储系统组合出击
Alamo-D:针对高带宽应用场景;Annapurna:针对高IO、低延迟应用场景;Alamo:针对冷数据存储需求。
感知应用
存储系统感知应用特征,调度合适的存储资源。
感知数据
存储系统具备数据感知能力。
数据管理—数据感知,秒级反馈;
管理系统能够感知数据特征,解决数据复杂性问题。
数据发现
海量数据中实现秒级数据查找。
数据溯源
帮助用户构建整个数据的族源关系,例如可追溯VCF文件的基因文件来源以及分析流程中工具版本等。
数据多维有序
帮助客户多维度理解、分析数据。可帮助管理员查找空间使用最大的用户、重复冗余的数据等。
数据重组
无需手动将有关联的数据复制到同一目录,通过数据重组可以得到一个具有相同特征的数据集,作为大规模生物信息分析计算的输入。
数据计算—分布式调度、应用感知融合多计算框架;
按需动态构建计算框架,简化流程编排,灵活高效的组织生物信息分析流程、调度生物信息作业 。
流程编写简单
流程编写难度较比传统SGE、LSF的方式难度大大降低。
应用感知,智能调度
可以感知应用的IO类型,不仅可以调度计算资源,也可以将数据调度到合适的存储位置上。
灵活省心
将程序(工具)封装进Docker,规避软件版本依赖关系和冲突的问题。
融合多计算框架
动态构建批量计算、Spark等多种计算集群。
突破集群规模瓶颈
分布式计算环境,多集群统一调度,多调度器之间相互协作,规模无限。
数据洞察—数据可视化,基因分析更直观。
根据多维度数据特征,利用网络可视化算法和工具,通过对可视化数据特征之间的关系进行关联,定性指导生物信息,基因分析的研究方向。
基因分析解读
基因组注释解读软件,用于解读人类基因变异;支持30+常用生物医药数据库,整合生物医药数据库>200GB;变异解读引擎可以随时动态开关不同的解读功能,深度挖掘变异结果所包含的意义。
基因组浏览器
高性能基因组浏览器软件用于对多个基因组的基因数据进行可视化处理;多重定制的视窗角度去挖掘变异数据;网页式运行模式,多平台支持,无需额外安装。
荣之联BioStack私有云可贴合医学检验所、测序公司、科研机构等用户需求进行定制化部署。既可满足日常计算、存储需求,也可实现平台级全流程搭建(含IDC)。
- 按需部署 各节点打通 -