Kotlin 性能优化利器 —— Sqeuence 原理浅析

前言

本文将介绍 Kotlin 中 序列(Sequence)的概念及使用,并介绍该惰性集合操作对集合链式调用性能优化背后的原理。

阅读本文大概需要 5 分钟,写作本文大概消耗 7 个小时

目录

序列(Sequence)

概念

在使用 Kotlin 集合操作符进行链式调用时,例如 map 和 filter 时,都会在函数内部创建中间集合,比如下面的例子,使用 map 和 filter 在 User 集合中筛选出性别为男的成员,返回结果是一个集合。

users.map(User :: sex)

序列的用法

序列的用法很简单,只需要再集合后添加asSeqence() 函数即可

users.asSequence()     .map(User :: sex)     .filter {it.sex.equals("male")}

这里插播一个概念,其中 User :: user 是成员引用,具体介绍如下

成员引用(Member References)

概念

成员引用可以使你方便的调用某个类的成员,这个成员包括对应类的属性或方法.双冒号前的是被引用的类,双冒号后是需要返回的属性或方法名,如下所示是返回 User 成员的 sex 属性:

User :: sex

成员引用可以方便的赋值给其他变量或函数,例如上述寻找性别为 male 的例子,也可以用稍微复杂的写法,如下:

users.map(user : User -> user.sex)     .filter {it.sex.equals("male")}

可见成员引用的写法可读性更强。

再谈序列

让我们回到序列介绍。上文提到使用 map 和 filter 时,都会在函数内部创建中间集合,这会导致一个问题,如果源列表,就是 users 中元素特别多,集合的链式处理会变得十分低效,原因是创建了多次中间集合。而如果先将待处理集合通过 asSequence() 方法转换为序列,再进行 map 和 filter 操作,就会变得十分高效。对于是否使用序列进行集合操作,有几个前提,如果使用不当,反而会造成性能损失。这里总结一下使用场景:

序列性能测试

上文提到,是否使用序列的条件之一是处理大量数据,那么这个阈值究竟是多少?下面来进行一个性能测试,构造一个商品列表,其中每个商品包含商品名和价格两个属性,现在要求出对每个商品的价格加价 100 后,价格为奇数 的商品的个数,这里用到了 count() 方法,作用是求得集合内满足 count 条件的元素的个数,代码如下:

/** * 商品类 */data class Commodity(var name: String, var price: String)
import java.util.*fun main(args: Array<String>) {    val commodityList = ArrayList<Commodity>()    for (i in 0..1000000) {        val goods = Commodity("商品 $i", i * 5)        commodityList.add(goods)    }    val startTime = System.currentTimeMillis()    commodityList            .asSequence() // 使用此函数代表使用 Kotlin 序列功能            .map { it.price + 100 }            .count { it % 2 != 0 }    println("consume time is ${System.currentTimeMillis() - startTime} ms")}

测试结果折线图如下,其中横坐标为集合内元素的个数,纵坐标为代码执行时间,橙色线代表未使用序列,蓝色线代表使用序列:

表格对比如下:

由图可得出如下结论:

  • 上文提到的阈值大致为「一百万」个元素,大于该阈值时,使用序列大致能带来 90 % 的性能提升

  • 在小于「十万」个元素时,使用序列反而会造成性能下降

为什么序列会提高集合操作的性能?

  1. 序列对集合的操作是惰性的。

  2. 不需要额外的创建中间集合保存链式操作的中间结果

对于第一点,惰性这个词可能给人带来迷惑,这和使用序列后,集合的计算方式有关,下面来介绍这一点,在下面这个例子中,你需要在一个整型数据集合,将每个数乘以 2 ,并找出集合中小于 10 的第一个元素。

var result = listOf(2,4,6,8,10).asSequence                  .map(it * 2)                  .find(it > 10)

find() 方法的作用是在集合中查找满足条件的第一个元素,并返回查找到的值。

下图是 Kotlin 使用序列进行处理

由图可知,所谓惰性,就是在使用 map 或 filter 等操作符的时候,在代码的执行顺序上,不会优先遍历所有的集合,即偷个懒,先对集合中第一个元素进行 map 和 filter, 然后对该元素执行 find 操作,发现满足 find 的条件,就立刻返回结果,由此可见,在有 map 和 find 或 last 等操作符组合时,序列的性能优化能发生最大的作用。

小结

  1. 在进行集合操作时,使用序列操作符,可以降低集合操作的时间和占用的空间,降低时间的原因是惰性操作,降低空间占用的原因是序列在执行操作时不会创建中间集合。

  2. 序列操作虽好,但也要视业务场景决定是否使用,否则反而会降低效率。

参考文献

  • 《实战 Kotlin 》

  • Kotlin系列之序列(Sequences)源码完全解析

最后关于作者

作者目前在深圳,13年java转Android开发,在小厂待过,也去过华为,OPPO等,去年四月份进了腾讯一直到现在。等大厂待过也面试过很多人。深知大多数初中级Android工程师,想要提升技能,往往是自己摸索成长,不成体系的学习效果低效漫长且无助。

我花了一年时间整理出一份腾讯T4级别的Android架构师全套学习资料,特别适合有3-5年以上经验的小伙伴深入学习提升。

主要包括腾讯,以及字节跳动,华为,小米,等一线互联网公司主流架构技术。如果你有需要,尽管拿走好了。至于能学会多少,真的只能看你自己

全套体系化高级架构视频;七大主流技术模块

部分展示;java内核视频+源码+笔记

 

免费分享

点击获取资料文档;

《腾讯T4级别Android架构师技术脑图+全套视频》​link.juejin.im

为什么免费分享?

我不想有很多开发者朋友因为门槛而错过这套高级架构资料,错过提升成为架构师的可能。国内程序员千千万,大多数是温水煮青蛙的现状,靠着天天加班,拿着外人以为还不错的薪资待遇。

请记住自身技术水平才是我们的核心竞争力,千万别把年轻和能加班当做本钱。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值