从使用传统的关系型数据库转到使用云存储,既要满足良好的数据运算性能,又要能够使数据管理像使用数据库一样方便,于是基于hadoop云架构的类数据库产品成为一个迫切的应用需求,我们这个云平台只从软件上面来分析,目的是使用软件平台来管理和解决硬件瓶颈问题。下面来说说我们云平台的具体需求:
第一:对硬件的需求
1、不能对硬件提过多的配置需求(比如CPU、内存、硬盘等)满足CPU≥2核,内存≥4G,硬盘≥500G的服务器都可以使用;
2、不能要求特定的硬件型号;
3、各节点之间的网络带宽≤10M;
4、节点线性扩展满足≥500;
第二:功能需求
1、此平台必需是标准化通用软件产品,具备完整的开发接口,有完善的API文档,方便第三方基于此进行二次开发;
2、支持常用数据库(oracle、mysql、mssql、db2等)数据的全量和增量的导入导出,文本数据(XML、TXT、EXCEL等)的导入导出;
3、支持结构化数据和非结构化数据的管理,支持数据的增删改查;
4、支持各类流媒体和各类文件的存储/更新/查询,支持基于文件内容的检索;
5、支持类数据库服务,数据仓库服务,实现基于SQL或者类SQL的操作;
6、支持JDBC连接访问;
7、支持DML(如insert、delete、update等)和DDL(如create table);
8、支持PB级数据的模糊查询、排序、分组、多表关联查询、子表关联查