大数据架构文章整理

最新推荐文章于 2024-02-28 22:40:19 发布

d4shman

最新推荐文章于 2024-02-28 22:40:19 发布

阅读量919

点赞数

分类专栏：大数据处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wusuopuBUPT/article/details/50921440

版权

大数据处理专栏收录该内容

4 篇文章 0 订阅

订阅专栏

以下是学习数据分析过程中用到的文档：

一、 Hadoop相关：

0. hadoop十年解读与发展预测： http://www.infoq.com/cn/articles/hadoop-ten-years-interpretation-and-development-forecast

1. Hadoop集群搭建： http://blog.csdn.net/weixuehao/article/details/15813681

2. 分布式文件系统HDFS的架构和设计： https://hadoop.apache.org/docs/r1.0.4/cn/hdfs_design.html

3. Hadoop fs shell命令：https://hadoop.apache.org/docs/r1.0.4/cn/hdfs_shell.html

4. mapreduce计算框架原理：

http://www.snia.org/sites/default/education/tutorials/2013/fall/BigData/SergeBazhievsky_Introduction_to_Hadoop_MapReduce_v2.pdf

5. mapreduce的核心shuffle and sort: http://langyu.iteye.com/blog/992916

6. hadoop streaming: https://hadoop.apache.org/docs/r1.2.1/streaming.html

7. hadoop Sqoop: https://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html

8. hadoop streaming multiple output: http://stackoverflow.com/questions/18541503/multiple-output-files-for-hadoop-streaming-with-python-mapper

二、 Hive相关：

1. Hive编译成mapreduce: http://tech.meituan.com/hive-sql-to-mapreduce.html

2. Hive数据存储模式： http://www.iteblog.com/archives/866

3. Hive内部表和外部表： http://www.aboutyun.com/thread-7458-1-1.html

4. Hive的left join、left outer join和left semi join三者的区别: http://www.crazyant.net/1470.html

5. Hive regex_extract: http://blog.csdn.net/lxpbs8851/article/details/39202735

6. get_json_object, lateral view等函数用法： http://my.oschina.net/leejun2005/blog/120463

三、瓦利哥的专栏：

http://zhuanlan.zhihu.com/sangwf （讲了百度大数据从0到1的架构演变）

四、Spark：

1. Spark的核心--RDD: http://www.infoq.com/cn/articles/spark-core-rdd

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
大数据架构文章整理

以下是学习数据分析过程中用到的文档：一、 Hadoop相关：1. Hadoop集群搭建： http://blog.csdn.net/weixuehao/article/details/158136812. 分布式文件系统HDFS的架构和设计： https://hadoop.apache.org/docs/r1.0.4/cn/hdfs_design.html3. Ha
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。