Vector Multiplication
- Task: multiply 2 arrays of N numbers
A basic mathematical operation
Let’s assume N is very large
向量乘法问题描述:
当N非常大时,如何使用map-reduce解决?
所以,先回想一下map之前,是不是先要将文件spilt一下?
但是问题来了,spilt之后,如何知道哪个跟哪个是对应的呢?因为这个切分后的文件里面都只有数值,并没有标号,也就是没有 <key,value> <script id="MathJax-Element-994" type="math/tex"> </script>中的key,只有value
Hadoop提供解决方法:
Map阶段对数据进行标记&