- 博客(6)
- 资源 (14)
- 收藏
- 关注
原创 Hadoop 为什么不建议使用 RAID?
因为采用 RAID 会有下面三个缺点: 1. 性能会有所降低,主要受限于最慢的disk(哪怕一个品牌的disk,性能也会不一样); 2. 磁盘整理可用性降低,其中一块或是几块盘坏掉,可能会造成整个 RAID 都不可用; 3. 可能会造成资源浪费,Hadoop 中每份数据都会有三个副本,存在冗余的 RAID 就没有必要;综合以上,说明 Hadoop 不建议使用 RAID。
2015-10-30 09:36:21 7316 7
原创 Hive 安装教程
Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的 sql 查询功能,可以将 SQL 语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的 MapReduce 统计,不必开发专门的 MapReduce 应用,十分适合数据仓库的统计分析。 本文主要介绍在 CentOS 下 安装 Hive环境。
2015-10-26 14:17:29 13875
原创 Hadoop 安装教程
本文主要介绍在 CentOS 安装 CDH,具体版本信息如下: OS: CentOS 7.0 Java: jdk1.7.0_79 Hadoop: hadoop-2.6.0-cdh5.4.7
2015-10-26 10:43:49 2479
原创 Hive 问题汇总
1 Cannot execute statement: impossible to write to binary log since BINLOG_FORMAT = STATEMENT…当启动Hive的时候报错:Caused by: javax.jdo.JDOException: Couldnt obtain a new sequence (unique id) : Cannot execute
2015-10-23 17:01:07 15390 2
原创 常用的 mysqldump 命令汇总
1 导出数据库-- 导出所有数据库的所有表数据以及表结构mysqldump -h127.0.0.1 -umyuser -pmypasswd -A > all_db.sql-- 导出指定数据库‘mydatabase’的所有表数据以及表结构mysqldump -h127.0.0.1 -umyuser -pmypasswd mydatabase > mydatabase.sql-- 导出指定数据库‘m
2015-10-20 18:06:46 716
ceph资料打包大汇总.zip
2020-05-15
Pinot架构介绍
2015-07-03
Glibc内存管理-Ptmalloc2源代码分析
2012-10-09
列存数据库研究
2012-08-23
UNIX环境高级编程.rar
2012-06-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人