1、分布式特点:
分布式是在不同的地方通过通信网络连接起来实现数据资源的共享与处理,特别地,针对高并发和大数据量的任务。
2、了解hadoop各种组件 hive、hbase、mahout
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
1、分布式特点:
分布式是在不同的地方通过通信网络连接起来实现数据资源的共享与处理,特别地,针对高并发和大数据量的任务。
2、了解hadoop各种组件 hive、hbase、mahout
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。