京龙号生物信息学高性能计算平台是北京太速科技有限公司历时两年研发的第一代异构计算服务器。产品以X86高性能计算服务器结合并行计算FPGA、高速大容量存储完成的异构系统。产品基于Linux操作系统,面向生物信息学方向开发FPGA并行计算及X86快速计算程序,结合上层交互界面,形成完整的生物信息学高性能计算平台。是该学科科研、教育、应用开发的理想服务器产品。
生物信息学是结合基因蛋白质学及信息科技的新兴研究领域,其最终目标在发现新的生物认知、分清细胞各阶段的表现,以利于对疾病和药物使用有更精确的了解。现阶段执行任务有分析核酸序列、蛋白质序列、蛋白质结构、蛋白质家族及其生化反应。
号 | NF5280M5 |
处理器 | 2颗英特尔®至强®可扩展处理器 |
内存 | 24个内存插槽,最高支持DDR4-2666内存 |
RAID | 可配置带缓存的存储控制器,支持断电保护模块 |
存储 | 前置:最大支持24个前置2.5寸硬盘,或12个3.5寸硬盘。支持24个NVMe SSD全闪配置。 内置:最大支持4个3.5寸硬盘和2个M.2 SSD 后置:最大支持4个3.5寸和4个2.5寸硬盘 |
I/O | 最大可支持10个标准PCIe插槽,支持4个GPU |
网络控制器 | 支持1个OCP网卡插槽 |
电源 | 1+1冗余电源,可支持高压直流及钛金级电源 |
1 板卡概述
本板卡系我公司自主研发,采用Xilinx公司的XCKU115-3-FLVF1924-E芯片作为主处理器,主要用于FPGA硬件加速。板卡设计满足工业级要求。如下图所示:
图 1:硬件加速卡实物图
图 2:硬件加速卡结构框图
2 技术指标
- 标准PCIe半高、半长卡,符合PCI Express 3.0 规范。
- 支持PCIe x1、x4、x8模式。
- 支持2x72bit(数据位宽64bit+ECC)DDR4存储,数据传输速率2400Mb/s。
- DDR4单簇容量4GB,总容量为8GB。
- 板载4个用户可编程LED。
- 加载方式:BPI模式。
3 物理特性
- 工作温度:商业级 0℃ ~ +55℃,工业级-40℃~+85℃。
- 工作湿度:10%~80%。
4 供电要求
- 单电压供电:电压:DC +12V,6A。
- 金手指取电。
- 纹波:≤10%。
5 散热系统
- 采用无风扇被动式散热。
主要参数 | |
存储容量 | 2T |
传输接口 | PCI-E 2.0 X8 |
电源电压 | 12V+/-8% |
基本参数 | |
存储容量 | 2TB |
传输接口 | PCI-E 2.0 X8 |
最大读取速度 | 4000MB/s |
最大写入速度 | 2400MB/s |
技术参数 | |
电源电压 | 12V+/-8% |
其他参数 | |
产品尺寸 | 190×83×20mm |
其他特点 | 读寿命:无限 |
计算平台软件是一个综合的异构计算软件,以Linux操作系统作为整体管理,生物信息学软件算法根据归纳整理,分解成适合FPGA并行计算,或者X86加速计算的模式,形成一种组合算法。FPGA产生并行计算单元程序,通过PCIe动态加载到FPGA,配合X86程序实现智能计算。人机交互应用管理实现参数设置,PCIe硬盘高速读写,从而完成具体的工作任务。
Linux操作系统可以选择
- Rocks Cluster5.4
- CentOS 5.5
- RedHat AS 4
计划使用CentOS7.1
- 生物智能计算算法分解成X86加速计算单元和FPGA并行计算单元;
- X86 软件以open CL open CV 为基础,结合Matlab的仿真分析;
- FPGA软件 以Xilinx的开发工具 Vivado为基础,遵循高性能并行计算标准。支持PCIe X8 V3.0规范;FPGA支持双路DDR4 72bit访问;支持CAPI FPGA架构;支持SDAccel 软件环境,支持 Cloud Acceleration for RTL, C/C++, and OpenCL。
主要包括:
- 参数配置、结果显示、描述、绘制;
- PCIe硬盘管理及高速读写;
- FPGA程序的PCIe动态加载;
1、超大规模的数据处理
- 基因组测序序列:5*1020量级;
- 蛋白质折叠计算:3*1023量级;
- 药物设计:平均筛选10000种化合物以上才能得到一种新药;
2、超大规模的计算方法
- 分子动力学模拟;
- 分子相互作用网络;
- 分子进行分析;
- 蛋白质结构模拟;
基因生物学分析包括:序列组合,序列分析,比较基因学,计算基因遗传学,基因认定,基因微数组芯片分析;蛋白质三维结构分析,分子演化,药物设计等。