Clojure学习03:数据结构(集合)

Clojure提供了几种强大的数据结构(集合)

一、集合种类

1、vector

相当于数组,如: [2  3   5]  ,  ["ad"  "adas"  "adadsads"]

2、list

相当于链表,如: '(2  3   5)  ,  '("ad"  "adas"  "adadsads")

与vector相比,[]变成了() ,又因为 ()符号是用于函数调用,为了区别,需要在 ( 前面加上  一个单引号'

3、map

语法格式如: {:a  1  :b  1} 

map是1个或多个 key-value对,其中key标识符前面要求有:标识 。map的key本身就是函数,通过它可以查找它所对应的值。

如:

user=> (def data {:a 1 :b 2} )

user=> (:a data)
1
user=> (:a {:a 1 :b 2} )
1
user=> (:a {:a 3 :b 2} )
3

上面第一个语句定义了一个值data,是个map。 第二个语句是获取关键字:a的值,这里:a就是一个函数。
最后两个语句就是直接从map字面量上查询key对应的值。

4、set

语法格式如: #{值1  值2  ....}

user=> #{1 2 3}
#{1 3 2}

说明,相比java的集合,Clojure的集合对象有如下几个特征:

1) immutable  集合的内容在初始化后是不可修改的,后续对它的操作都会产生新的集合

2)heterogeneous  多相(异种的),集合中的元素不要求必须是同一种数据类型,可以是不同类型数据的集合

3)persistent 持久化的,集合的内容是不可修改的,相关的操作会产生新的集合,但并不是复制的方式,而是有点类似配置管理的机制,只是新增变更的部分,老的部分还是采用原来的数据。这样所有的历史数据都能完整的保留下来。

 

二、集合的三大操作

所有函数式编程语言,都对集合的操作提供了一些基础的高阶函数,最典型的是  filter ,map 和 reduce三个函数。

这个三个函数高度概括了对集合的操作。

下面我们分别介绍。

 

1、filter函数

filter函数是函数式编程中对集合操作的三大重要操作之一,几乎所有的支持函数式编程的语言都有类似的方法。

其作用是筛选出满足条件的元素组成一个新的集合返回。

filter函数需要两个参数,第一个是过滤函数,用于检查元素是否符合,第二个是集合本身。结果返回一个list。

如下面例子:

例1:

user=> (def stooges ["Moe" "Larry" "Curly" "Shemp"])
#'user/stooges
user=> (filter #(> (count %) 3) stooges)
("Larry" "Curly" "Shemp")

上面代码中的count函数是计算字符串的长度, #(> (count %) 3) 是个匿名函数,只有长度大于3的字符串才满足条件。

例2:

user=> (def years [1940 1944 1961 1985 1987])
#'user/years
user=> (filter #(even? %) years)
(1940 1944)

 

2、map

map函数是函数式编程中对集合操作的三大重要操作之一,几乎所有的支持函数式编程的语言都有类似的方法。

其作用是 对集合中的每一个元素做处理,最后得到一个新的集合(注意集合类型是列表),新集合的元素个数和原集合一样,但内容可以不一样(包括元素的类型)。

所以map函数 的第一个参数是对元素转换的处理函数,后面的参数是待处理的集合(一个或多个)。

下面我们举例来说明:

例1:

(defn fun [item] (* item 2))   //定义了一个函数,返回的值是对输入参数乘以2

(map fun [1 2 3])   //map函数使用了fun函数,最后map函数调用后的返回结果为 (2 4 6)

可以看出,被处理的集合是vector,但处理后返回的集合类型为list

例2:

user=> (map fun #{1 2 3}) (2 6 4)

可以看出,set被处理后返回的集合类型也是列表,而且因为set本身是无序的,返回的list结果序号与set表面上看的也不一致。

例3:

user=> (map + [2 4] [5 6] [1 2]) (8 12)

user=> (map + [2 4 7] [5 6] [1 2 3 4]) (8 12)

上面两个例子传入的第一个参数是函数是 + , 后面是多个集合。最后的结果是按照最小的集合元素算的。

例4:

user=> (map #(* % 2) [1 2 3]) (2 4 6)

上面代码中传给map的是一个匿名函数  #(* % 2) 。在实际的集合map操作中,大量场景下会传入匿名函数。

Clojure中的匿名函数就类似于 python、java8中的lambda表达式。

 

3、reduce

reduce函数是函数式编程中对集合操作的三大重要操作之一,几乎所有的支持函数式编程的语言都有类似的方法。

其作用是对集合做处理,得到一个计算后的值。 如sum ,count, max, min 都是reduce操作的特例,只不过这些操作是非常常见和通用的 ,会被提为专门的方法。

如:

user=> (reduce #(+ %1 %2) [1 2 3])
6

上面操作是对集合求和。reduce的第一个参数是一个函数,这里是匿名函数,该匿名第一个参数(用1%代替)是每次迭代的返回值,%2是元素。

每次对元素操作,1%都会重新最后作为参数传入,最后一个元素处理完后%1的值会作为reduce的函数值返回。

user=> (reduce #(* %1 %2) [2 4 6])
48

上面操作是对集合中的元素求乘积。

user=> (reduce #(if (> %1 %2) %1 %2) [10 2 54 3 6])
54
user=> (reduce #(if (< %1 %2) %1 %2) [10 2 54 3 6])
2

上面的两个操作分别是取最大值和最小值。

 

三、集合的其它操作

下面介绍的集合的操作都是对上述三大操作的一些特例。

1、count函数

该函数用于获取集合中的元素个数

user=> (count [19 "yellow" true])
3
user=> (count '(19 "yellow" true))
3
user=> (count #{19 "yellow" true})
3
user=> (count {:a 1 :b 2})
2

从上面例子可以看出,count函数对这四种集合都是适合的。

 

2、reverse

该函数是对集合中的数据进行反转排列,返回一个新的集合。因为map和set本身是无序的数据结构,所以reverse函数也只对vector和list有意义。

user=> (reverse [2 4 7])
(7 4 2)
user=> (reverse '(2 4 7))
(7 4 2)

 

3、map

map函数的作用是 对集合中的每一个元素做处理,最后得到一个新的集合(注意集合类型是列表),新集合的元素个数和原集合一样,但内容可以不一样(包括元素的类型)。

所以map函数 的第一个参数是对元素转换的处理函数,后面的参数是待处理的集合(一个或多个)。

下面我们举例来说明:

例1:

(defn fun [item] (* item 2))   //定义了一个函数,返回的值是对输入参数乘以2

(map fun [1 2 3])   //map函数使用了fun函数,最后map函数调用后的返回结果为 (2 4 6)

可以看出,被处理的集合是vector,但处理后返回的集合类型为list

例2:

user=> (map fun #{1 2 3})
(2 6 4)

可以看出,set被处理后返回的集合类型也是列表,而且因为set本身是无序的,返回的list结果序号与set表面上看的也不一致。

例3:

user=> (map + [2 4] [5 6] [1 2])
(8 12)

user=> (map + [2 4 7] [5 6] [1 2 3 4])
(8 12)

上面两个例子传入的第一个参数是函数是 + , 后面是多个集合。最后的结果是按照最小的集合元素算的。

例4:

user=> (map #(* % 2) [1 2 3])
(2 4 6)

上面代码中传给map的是一个匿名函数  #(* % 2) 。在实际的集合map操作中,大量场景下会传入匿名函数

Clojure中的匿名函数就类似于 python、java8中的lambda表达式。

 

4、apply

该函数的作用是给它传入一个函数和集合,该函数对整个集合进行操作后返回的结果就是apply函数的返回结果。

 user=> (apply + [2 4 6])
12
user=> (apply * [2 4 6])
48
user=> (apply - [2 4 6])
-8

 

5、从集合中获取单个元素

user=> (def stooges ["Moe" "Larry" "Curly" "Shemp"])
#'user/stooges
user=> (first stooges)
"Moe"
user=> (second stooges)
"Larry"
user=> (last stooges)
"Shemp"
user=> (nth stooges 2)
"Curly"

最后一个方法nth的第2个参数表示获取第几个元素(从0开始,这里2代表第3个元素)。

 

6、从集合中获取多个元素

user=> (def stooges ["Moe" "Larry" "Curly" "Shemp"])
#'user/stooges


user=> (next stooges)
("Larry" "Curly" "Shemp")

user=> (nthnext stooges 1)
("Larry" "Curly" "Shemp")

user=> (nthnext stooges 2)
("Curly" "Shemp")
user=> (butlast stooges)
("Moe" "Larry" "Curly")

user=> (drop-last 1 stooges)
("Moe" "Larry" "Curly")
user=> (drop-last 2 stooges)
("Moe" "Larry")

7、some

该函数可以用来判断集合中是否包含某个元素,需要一个用来判断的函数作为参数,另一个参数是集合本身。如:

user=>  (def stooges ["Moe" "Larry" "Curly" "Shemp"])
#'user/stooges
user=> (some #(= % "Moe") stooges)
true
user=> (some #(= % "Mark") stooges)
nil

可以看出,如果存在则返回true,否则返回nil(为何不返回false呢?)。

上面的写法会看起来比较笨拙,可以用如下的方法达到同样目的:

user=> (contains? (set stooges) "Moe")
true
user=> (contains? (set stooges) "Mark")
false

上面操作,利用set方法将vector转换为set集合,然后利用contains?函数进行判断,看上去会更清晰简单些。

另外一个区别是,当元素不存在时返回的不是nil,而是false

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值