今天在熟悉项目代码的时候,看到了代码中用到了foldLeft方法,说来惭愧,用scala写了一年spark都没有用到这个方法,太菜了。
以下均个人理解,可能不是很对,欢迎交流。
概念
从字面意思上看,fold是折叠,那么foldLeft应该是向左折叠,foldRight应该是向右折叠。
在scala中亦是如此。
先以foldLeft
为例,泛型为B,第一个参数是B类型的值,第二个参数是一个返回值为B类型值的函数,返回值是B类型的值。
看看foldLeft
中作为参数传入的函数(op: (B, A) => B)
,这个函数第一个参数是B类型,第二个参数是A类型,返回值是B类型。
foldLeft
的第一个参数,会作为第二个参数所传入函数的B类型参数的默认值。
所以foldLeft
其实就是把右边的A类型值向左折叠到左边的B类型值上,并返回作为下一轮的左侧。遍历完成后返回。
再看看foldRight
,也是以第一个参数作为B类型的初始值,之后在第二个参数的函数中把左边的A右折叠到右边的B上,并返回作为下一轮的右侧。
需要注意的是,foldRight
会先将集合翻转。