有不少文章介绍python的map与reduce,这到底是什么样的东西呢?

先看看google的paper里对mapreduce的解释

http://static.googleusercontent.com/media/research.google.com/zh-CN//archive/mapreduce-osdi04.pdf


MapReduce is a programming model and an associated implementation for processing and generating large data sets. Users specify a map function that processes a key/value pair to generate a set of intermediate key/value pairs, and a reduce function that merges all intermediate values associated with the same intermediate key.



map

map(function, iterable, ...)的第一个参数是一个函数,第二个参数接受一个iterable对象(字符串,列表,元组等)。该函数返回一个列表。


python实现map的代码

实现:将输入的不规范的用户名转换成首字母大写的标准格式

逻辑写的简单点,就3种情况,当然可以写成4种,就相对复杂了。。。

  1. 初次循环,首字母小写

  2. 非初次循环,字母大写

  3. 其它(因为初次循环,首字母大写和非初次循环,字母小写默认就满足我们的需求)

def lower2upper(s):
    loop = 0   '''循环计数'''
    str = ""    '''定义一个空字符串'''
    for i in s:
        if i.islower() and loop ==0:
            str = str + i.upper()
            loop +=1
        elif i.isupper() and loop !=0:
            str = str + i.lower()
            loop +=1
        else:
            str = str + i
            loop +=1
    return str

result = map(lower2upper,["adam","LiSA","ChEn","Peter","tOM"])
print result



reduce
reduce(function, iterable[, initializer])把函数从左到右累积作用在元素上,产生一个数值。如reduce(lambda x, y: x+y, [1, 2, 3, 4, 5])就是计算((((1+2)+3)+4)+5)。Python提供的sum()函数可以接受一个list并求和,现实现一个prod()函数,可以接受一个list并利用reduce()求积。
def prod(list):
    def multiply(x, y):
        return x * y
    return reduce(multiply, list)

print prod([1, 3, 5, 7])

map和reduce
我们可以综合利用map和reduce来完成一个简单的字符串到数字的程序。
def str2int(s):
    def fn(x, y):
        return x * 10 + y
    def char2num(s):
        return {"0":0, "1":1, "2":2, "3":3, "4":4, "5":5, "6":6, "7":7, "8":8, "9":9}
    return reduce(fn, map(char2num, s))

print str2int("12345")
其中map用于将字符串拆分为对应的数字,并以list的方式返回。reduce用来累加各个位上的和。