函数式 编程初窥
最近在学习Erlang和Python。Erlang是完全的函数式编程语言,Python语言是面向对象的语言,但是它的语法引入了大量的函数式编程思想。越研究越觉得函数式的编程思路可以帮助我们规避很多Bug,所以在这里对函数式编程做一个简要的介绍。分析函数式编程的特点、方法论,使用的技术,以及同面向对象编程的异同。
1、函数式编程简介
背景
函数式编程诞生于50多年前。现在越来越多的人开始接受并进行函数式编程的实践。不仅最古老的函数式语言 Lisp 重获青春,而且新的函数式语言层出不穷,比如 Erlang、clojure、Scala、F#等等。目前最当红的Objective-C, Python、Ruby、 Javascript都引入了对函数式编程的支持。就连老牌的面向对象的 Java、面向过程的 PHP, 以及苹果最新的swift语言,都忙不迭地加入匿名函数等机制。
越来越多的迹象表明,函数式编程已经不再是学术界的最爱,开始大踏步地在业界投入实用。 也许继面向对象编程之后,函数式编程会成为下一个编程的主流范式。
说到函数式编程编程就不得不说面向对象。面向对象是把一个功能的一组操作和相关数据封装在一个对象里,面向对象是对象满天飞。函数式编程是把一个功能的一个操作和相关数据封装在一起,函数式编程是函数满天飞。函数式编程比面向对象的优势就是粒度更小,生命周期更短。减少bug的有效途径就是减少变量的生命周期,缩小模块的粒度;所以函数式编程更不容易引入bug。
定义
是一种编程范型,它将计算机运算视为数学上的函数计算,并且避免使用程序状态以及易变对象。函数编程语言最重要的基础是λ演算(lambda calculus)。λ演算中最关键的要素就是函数被当作变量处理,能够参与运算。
价值观
- 函数式编程强调程序的执行结果比执行过程更重要。关注于描述问题,而不是怎么实现,隐藏实现细节。
- 化繁为简。利用若干简单的执行单元让计算结果不断渐进,逐层推导复杂的运算。
- 你的优秀和我的人生无关,请带着你的趾高气扬滚蛋吧。
下面是一个输出数组的例子
shoplist = ['apple','mango','carrot','banana'] print 'My shopping list is now', shoplist #输出 #My shopping list is now ['banana', 'carrot', 'mango', 'rice']
这样的代码更易读,代码只是描述在干什么,而不是如何做到这点的具体实现。如果是过程式编程,需要一个for循环去描述实现细节。
函数式编程在解决复杂运算问题时,把一个问题分解为若干子问题,逐步求解。软件或程序的拼装会变得更为简单和直观。使代码更容易理解,方便排查问题,并且具有更好的可维护性和扩展性。
现在有这样一个数学表达式:
(1 + 2) * 3 - 4
传统的过程式编程:
var a = 1 + 2;
var b = a * 3;
var c = b - 4;
函数式编程要求使用函数,我们可以把运算过程定义为不同的函数,然后写成下面这样:
var result = subtract(multiply(add(1,2), 3), 4);
你的优秀和我的人生无关,请带着你的趾高气扬滚蛋吧。这个就是函数式编程的准则:函数不受外部变量影响,不依赖于外部变量,也不改变外部变量的值。
传统的过程式编程:
int count; void increment() { returen count++; }
函数式编程:
def increment(count): return count+1;
函数不访问全局变量,也不改变全局变量。
2、函数式编程特性
封装、继承、多态是面向对象编程的三大特性。函数式编程也有自己的语言特性。
数据不可变性(immutable data)多有的变量只可以赋值一次,变量不可变,如果想改变变量就创建一个新的变量。
数据的不可变性保证了程序是无状态的,很多难解的bug往往是由各种复杂的状态引起的。比如发现某些情况下程序运行有问题,是某一个状态引起的,但是这个状态有100种可能性,在1000个地方都有对这个状态进行操作。debug的时候要杀人的心都有了。数据不可变性同时保证了函数没有“副作用”,函数的副作用是指除了返回函数值外,还对主调用函数
函数是第一公民(first class method)函数可以像普通变量一样去使用。函数可以像变量一样被创建,修改,并当成变量一样传递,返回或是在函数中嵌套函数。
引用透明(referential transparency) 指的是函数的运行不依赖于外部变量或“状态”,只依赖于输入的参数,任何时候只要参数相同,调用函数所得到的返回值总是相同的。天然适应并发编程,因为调用函数的结果具有一致性,所以根本不需要加锁,也就不存在死锁的问题。
尾递归化(tail call optimization)因为函数调用要压栈保存现场,递归层次过深的话,压栈过多会产生性能问题。所以引入尾递归优化,每次递归时都会重用栈,提升性能。
把函数作为参数传递的例子
NSComparisonResult (^cmp)(id obj1, id obj2) = ^NSComparisonResult(id obj1, id obj2) { return [obj1 isEqualToString:obj2]; } NSArray* items = [@"a", @"c", @"d"]; [items sortedArrayUsingComparator:cmp];
sortedArrayUsingComparator方法负责排序,需要把比较的规则告诉他,将比较方法作为一个参数传到函数中进行运算。
3、函数式编程技术(方法论)
- 映射化简(map & reduce)函数式编程最常见的技术就是对一个集合做Map和Reduce操作。这比起过程式的语言来说,在代码上要更容易阅读。传统过程式的语言需要使用for/while循环,然后在各种变量中把数据倒过来倒过去的
- 管道 (pipeline)把一组函数放到一个数组或是列表中,然后把数据传给这个列表,数据就像一个pipeline一样顺序地被各个函数所操作,最终得到我们想要的结果。他的设计哲学就是让每个功能就做一件事,并把这件事做到极致,软件或程序的拼装会变得更为简单和直观。
- 递归 (recursing)递归最大的好处就简化代码,他可以把一个复杂的问题用很简单的代码描述出来。递归的精髓是描述问题,而这正是函数式编程的精髓。
- 柯里化 (currying)把一个函数的多个参数分解成多个函数, 然后把函数多层封装起来,每层函数都返回一个函数去接收下一个参数。
- 高阶函数(higher order function)把函数当参数,接受一个函数作为参数的函数就叫高阶函数。现象上就是函数传进传出。
map & reduce
Python代码:
def toUpper(item) return item.upper() print map(tuUpper , [“hellow”,”world”])
将数组里的所有字符串变为大写,直接使用map,不需要写for循环。最后输出 ["HELLO","WORLD"]
print reduce(lambda x , y : x + y,[1,2,3,4,5])
将数组里所有数值进行累加,相当于1+2+3+4+5,输出 15。
lambda是Python的匿名函数,lambda x,y:x+y相当于def func(x,y):return x+y
管道
如果有一个需求找出一组数中的所有偶数并对他们求平方,最后求他们的和,可以分解成三个步骤:
1)找偶数
2)求平方
3)累加
def even(nums): return filter(lambda x: x%2==0, nums) def square(nums): return map(lambda x: x*x, nums) def total(nums): return reduce(lambda x,y:x+y,nums) nums = [1,2,3,4,5,6,7,8,9,10] pipeline = total(square(even(nums)))
even方法求偶数,square求他们的平方,total方法将他们加在一起。通过管道的方式把他们串联在一起,一个复杂的处理就完成了。
让每个方法只做一件事,并把这件事做到极致。
递归
在其他类型的语言中,变量往往用来保存状态。变量不可变,意味着状态不能保存在变量中。函数式编程使用参数保存状态,最好的例子就是递归。
void fun(const int i) { if (i < 10 && i >= 0) { NSLog(@"i:%d", i); fun(i + 1); } }
每次状态的变化就是值+1。
柯里化
柯里化就是一个函数只有一个参数,那如果需要两个参数怎么办,比如两个数相加求和。通过把一个参数封装成函数的方式实现。
def func(a): def add(b): return a+b return add funcA = func(5) print funcA(10)
func函数返回一个add函数,funcA变量就是一个a为5的add函数。print funcA(10)就是向add函数传入10,最后结果就是5+10 输出15。
4、函数式编程意义
1、代码简洁,快速开发
函数式编程大量使用函数,减少了代码的重复,因此程序比较短,开发速度较快。
2、接近自然语言,易于理解
函数式编程注重干什么而不是怎么干,更容易理解。
3、方便代码的管理和维护
函数式编程不依赖、也不会改变外界的状态,只要给定输入参数,返回的结果必定相同。因此,每一个函数都可以被看做独立单元,很有利于进行单元测试 (unit testing)和除错(debugging),以及模块化组合。
4、易于进行并发开发
函数式编程因为它不修改变量,所以根本不存在"锁"线程的问题,不需要考虑"死锁"(deadlock)。不必担心一个线程的数据,被另一个线程修改,所以可以很放心地把工作分摊到多个线程中。
5、代码热升级
函数式编程没有副作用,只要保证接口不变,内部实现是外部无关的。所以,可以在运行状态下直接升级代码,不需要重启,也不需要停机。Erlang语言早就证明了这一点,它是瑞典爱立信公司为了管理电话系统而开发的,电话系统的升级当然是不能停机的。
最后,其实使用面向对象或者面向方法都不重要,重要的是如何理解其中的价值观和方法论,构造可维护、可扩展、稳定又灵活的程序。不管白猫黑猫抓到老鼠就是好猫。