简介
本系列教程主要探讨有关大数据的所有常用算法的实现,定期加入有趣的项目实践。
1、实现语言
初步使用java实现,后续加入python。
- Hadoop Mapreduce Java实现 位于包*.mapreduce下。
- Spark MapReduce Java实现 位于包*.spark下。
python实现会在以后加入。
每个算法存在一个模块,测试文件位置父模块根目录下,对应名字可从系列教程里面找到。
2、实现框架
- Hadoop 2.7.3
- Spark 2.4
3、参考
- 书籍《算法实现:Hadoop/spark》