张立贤:积跬步至千里,我与地学大数据的探索之旅 | 提升之路系列(五)

29b18217e92a7eafb6ea1ce5132755d9.png

导读

 

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

至今,已有来自全校45个院系的3055名同学参加大数据能力提升项目,其中556位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据提升之路吧!

fc7f0bf71217c9415aba88a5bf66afee.png

张立贤 清华大学地球系统科学系

挑战:山重水复疑无路

2018年秋天,我来到地学系攻读生态学博士学位,彼时我还是一个对于大数据、计算机视觉等一无所知的传统理科专业新生,大数据相关基础非常薄弱。上半学期的几门大数据项目基础课程都学得比较吃力,期末成绩也不甚理想。虽然期间萌生过几次退出大数据提升项目的念头,但我还是坚持下来并持续在课余投入更多的时间锻炼自己的编程能力和大数据基础知识。在下半学期,我的大数据专业课程成绩也有了明显的进步。

经过一年的大数据专业课程学习并深度投身大数据暑期实践,我已经初步具备大数据处理思维并掌握了一定的大数据编程基础。能够在师兄师姐的带领下,承担部分数据处理的工作,相关成果在 2020年发表(2篇)。实际科研中的经验积累也带给我一定的信心,并组队参加“华为云杯”2020深圳开放数据应用大赛。近两个月的比赛过程中,团队四人基本保持满负荷工作,我在其中负责算法调优和可视化,最终经过团队的不懈努力,获得第三名(高校组第一)的好成绩。

2e9efe917e3b52c740969f008c1e3dcc.png

华为云比赛中通宵调参(右 1:张立贤)

组队参赛的经历让我的编程基础和大数据思维能力在两个月的备赛过程中得到充分的锻炼。在参加一次学校组织的商汤公司就业实践后,我获得商汤的实习面试机会,并最终获得商汤 AI算法实习生的offer。这得益于在大数据项目过程中养成的钻研习惯,在商汤 leader的指导下,我也从一个完全不懂分布式集群、不会工程化部署的小白,不断成长不断进步。时至今日,我已经在商汤实习了近一年半,我已经成长为多尺度遥感影像质量改善算法研究的核心成员,今年 7月交付的超分模型得到了公司 leader和客户的一致好评,已累计为公司节省了数百万的数据成本。与此同时,在科研上,我也逐渐成长为可以独立发现问题、制定解决方案、完成方法实现与结果分析并撰写英文论文的博士研究生。

实践:纸上得来终觉浅

在实践科研中,我的博士选题是基于多源遥感数据的城市长时序特征提取。围绕这一研究,我在多源遥感数据融合、长时序城市时空特征提取和城市时空变化规律建模三个方面提出了多个基于深度学习的算法,并展现了较现有方法显著的提升。这里简要介绍其中三份工作。

第一份工作研究设计了融合无监督超分辨率重建和边缘增强的二阶段城市要素提取框架。在这一框架下,阶段一通过充分挖掘遥感图像内部的自相关性挖掘出遥感图像内部的重复规律从而构建自相关超分训练数据集,在充分训练后该网络将用于输送出分辨率相同的超分辨率遥感图像,并在此基础上送入第二阶段网络开展建筑物提取。在第二阶段的提取任务中,网络将通过梯度算子进一步挖掘图像内部的边界特征,构建超分图像和建筑物标注之间的关系,从而完成提取任务。

第二份工作中我们提出了一个面向真实场景的跨传感器遥感超分方法。该方法将超分任务分为两个步骤分别展开。首先是基于域迁移的低分影像降质模拟。通过输入高分影像,网络将不断学习高分到低分影像的降质过程,并在其中引入风格迁移的损失函数帮助网络模仿并生成真实低分影像。随后,在第二步骤中,通过构建出的真实低分辨率和高分辨率图像对进行网络训练,从而得到在真实数据集中表现好的超分辨率模型,从而完成跨传感器的遥感影像质量改善。

第三份工作研究设计了基于时空感知的深度学习网络,该网络可以充分挖掘输入信息在时间维度和空间维度的变化响应,建模其中的时空变化格局,从而基于现有观测到的变化规律对过去或者未来进行时空预测。基于这一方法我们生产出全球第一套覆盖中国区域的长时序逐年夜光数据集。

上述工作的部分成果已经陆续发表,今年有2篇一作文章、3篇二作文章发表在遥感领域的顶刊和顶会中。受益于计算机和大数据领域对于开放与交流的包容态度,我的所有算法都共享在 github开源社区中。此外还需要特别提到我们也开放了我们的成果数据。以全球首套的中国长时序夜光数据为例,开源半年多以来,累计下载量近 300次,浏览量超 2000次,获得了世界各地学者的广泛关注。

在科研与实习之余,我还积极参与实践,将所学与企业实际需求结合。今年6月,我暑期社会实践前往上海气象局参与智能极端降水预测的算法研发,我带领的团队在两百多支队伍中脱颖而出,荣获金奖支队(仅4支系级支队获得)。

609b63727f0df898edf7121b8c418466.png

金奖支队评选答辩现场(左1:张立贤)

未来我还将继续运用我在大数据项目过程中锻炼的能力、养成的良好习惯,把自己所学的知识与实际需求相结合,为祖国的发展和建设发光发热!

编辑:黄继彦

校对:杨学俊

65a9a7c1de3801ab36317c594d0a6b91.png

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值