- 博客(2)
- 收藏
- 关注
原创 这个配置决定了每个Input Split 的最小值
Hadoop MapReduce是一个用于处理海量数据的分布式计算框架,这个框架解决了诸如数据分布式存储,作业调度,容错,机器间通信等复杂问题,可以让没有分布式处理经验的工程师非常简单的写出并行分布式程序。 MapReduce采用“分而治之”的思想,将计算任务抽象成Map和Reduce两个计算过程: A.首先把输入分割成不相关的若干键值(key1/value1)集合,这些键值会有多个ma
2017-09-11 15:21:17 739
原创 Scikit-learn机器学习库的安装
scikit-learn是Python的一个开源机器学习模块,它建立在NumPy、matplotlib和SciPy模块之上能够为用户提供各种机器学习算法接口,可以让用户简单、高效地进行数据挖掘和数据分析。 系统:windows7 64位操作系统 Python版本:Python 2.7.12 模块下载地址:www.lfd.uci.edu/%7Egohlke/pythonlibs/
2017-09-06 10:33:21 956
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人