- 博客(3)
- 资源 (17)
- 收藏
- 关注
转载 【CDH】CDH大数据平台实施经验总结
1. 平台规划注意事项 1.1 业务数据全部存储在datanode上面,所以datanode的存储空间必须足够大,且每个datanode的存储空间尽量保持一致。 1.2 管理节点/namenode对存储空间要求不高,主要存储各计算节点datanode的元数据信息,以3个datanode为例,每个datanode存储2T的数据,namenode才耗费80G的空间。 1.3 由于hadoop有数...
2018-05-30 16:26:36 1928
原创 Hive中Sqoop的基本用法和常见问题
一、通过Sqoop将Hive表数据导入到Mysql1、第一种是将hive上某张表的全部数据导入到mysql对应的表中。2、第二种是将hive上某张表中的部分数据导入到mysql对应的表中。两种方式的区别在于第二种情况需要指定要导入数据的列名称。两种情况的导入方式分别如下:1.全部导入Sqoop export --connect jdbc:mysql://127.0.0.1:3306/dbname...
2018-05-25 17:42:05 1573
原创 Hive的基本用法
一、创建表hive建表的时候默认的分割符是'\001',若在建表的时候没有指明分隔符,load文件的时候文件的分隔符需要是'\001';若文件分隔符不是'001',程序不会报错,但表查询的结果会全部为'null';1、建表的时候指定分隔符:create table pokes(foo int,bar string) row format delimited fields terminated by...
2018-05-24 11:44:30 1536
《良心作品,绝对免费》利用Python进行数据分析(第二版)高清中文版英文版和源代码
2019-04-17
Tableau图表实战演练
2015-05-25
深入浅出统计学
2015-04-23
SPSS统计分析与数据挖掘(最新完整版)谢龙汉
2015-04-17
大嘴巴漫谈数据挖掘(完整版)
2015-03-10
RacerPro-2-0-Users-Guide-2-0-Preview.pdf
2013-12-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人