大数据能力提升项目| 学生成果展系列之一

导读

 

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

回首即将过去的2020年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自12个院系的16位同学代表一起领略他们的风采吧!

彭鹏

自动化系2017级博士生

就读于工业智能与系统集成所。曾获2019年丰田二等奖学金,2019年清华大学社会实践奖学金, 2020年清华校友李衍达励学基金,2020年社工优秀奖学金。研究方向是工业过程的故障诊断,目前已发表SCI论文3篇,EI论文6篇。平时喜欢打篮球和羽毛球,喜欢看书和刷电影。

成果展示

论文题目

Cost sensitive active learning using bidirectional gated recurrent neural networks for imbalanced fault diagnosis

选题缘起

针对于实际工业过程中故障样本较少以及存在大量的无标签样本的问题,提出了一种以及基于代价敏感的主动学习方法。

论文简介

针对于故障样本较少的问题,设计了一种样本敏感策略。具体来说,在故障发生时刻前后的样本权重应该大于其他时刻的样本。故障刚发生时,往往对过程的影响比较小,其与正常样本也较难区分,因此赋予比较高的权重有利于此类样本的判别。针对于工业过程存在的大量无标签问题,论文在主动学习的基础上考虑了代价敏感函数,并做了探讨和实验验证。

论文节选

滑动查看更多

  2021年祝语

愿所求皆所愿,愿所盼皆可期。

王家豪

自动化系控制工程研二学生

人民邮电出版社撰稿人,CV著名公众号“极市平台”签约作者,清华大学“RONG”奖学金一等奖获得者,华为技术有限公司优秀实习生。目前从事的研究方向是“面向端侧设备的深度学习模型优化与应用研究”。

就读于工业智能与系统集成所。曾获2019年丰田二等奖学金,2019年清华大学社会实践奖学金, 2020年清华校友李衍达励学基金,2020年社工优秀奖学金。研究方向是工业过程的故障诊断,目前已发表SCI论文3篇,EI论文6篇。平时喜欢打篮球和羽毛球,喜欢看书和刷电影。

成果展示

论文题目

GAN Streamlining: Progressive Searching for Versatile One-Shot GAN Compression

选题缘起

华为公司扎根通信,深耕移动端设备,轻量化的模型更能够带来绝佳的用户体验。目前GAN网络具备强大的生成能力,可以部署在大量端侧设备应用中,为用户带来良好的使用体验。但是GAN模型同样存在着参数量大,计算量大,延迟高的缺点,这些问题阻碍了GAN模型直接部署在端侧设备上。

论文简介

这篇论文完成了“基于神经架构搜索的生成对抗网络模型压缩”的任务,我们结合了神经网络架构搜索以及模型压缩的方案,设计了包含路径,操作,通道数这三个维度的搜索空间,以及针对GAN模型的公平的超网络训练手段,对于3个不同的模型对应的3个不同的任务,在不影响结果质量的前提下,模型的参数量分别压缩了约4.6倍,13.9倍,36.5倍。计算量分别压缩了10倍,11.4倍,24.3倍,帮助企业在该业务上取得了突破进展。

论文节选

滑动查看更多

  2021年祝语

大数据课程项目使我从一个学术小白成为了领域内的知名博主,优秀实习生和比赛老鸟。它带给我的不仅是知识和能力的培养,更重要的是眼界和胆识的提升。在今后的科研工作中,我会将这份精神发扬光大,每天都有进步,每日都有收获,争取在未来,在这个国际形势千变万化的时代里为国效力,成为一名优秀的清华学子。我与旧事归于尽,来年依旧迎花开。

赵雪轩

航天航空学院飞行器设计所博士生

研究方向为敏捷遥感卫星智能化技术。曾获第45届日内瓦发明展银奖,2020年“RONG”奖学金一等奖,2019年KDD Cup 比赛Regular ML Track 前5%,2018年中国高校SAS数据分析比赛第五名。

成果展示

论文题目

Two-Phase Neural Combinatorial Optimization with Reinforcement Learning for Agile Satellite Scheduling

选题缘起

由于人工智能和大数据技术的兴起,导师希望我的博士课题能够将传统的遥感卫星课题与新兴的智能技术结合起来,系统性地讨论新技术在敏捷遥感卫星课题上的应用。在敏捷卫星任务规划问题上,目前流行的启发式算法依赖于启发因子的设计,这种设计具有很强的问题导向,基于某数据集的设计不一定能保证在其他数据集上取得良好的任务规划结果。

论文简介

本文提出了一种考虑成像质量的TPNCO-RL算法来求解敏捷卫星任务规划问题。算法的第一阶段采用神经网络组合优化方法,以最大化观测收益为目标,从候选任务集合里选择合适的待观测条带序列。第二阶段针对成像质量优化待观测条带序列中每个条带的观测起始时间。针对传统启发式方法存在的问题,包括需要人工设计启发因子和需要进行基于假设的预计算,TPNCO-RL算法通过学习的机制无需设计启发因子,并可根据在轨计算结果进行任务规划。

论文节选

滑动查看更多

  2021年祝语

希望2021年大数据能力提升项目能越办越好,让更多的同学受益。

宁泽宇

水利系博士生

曾获清华大学2019年研究生社会实践奖学金、清华大学大数据研究中心2020年"RONG"奖学金等荣誉,主要研究方向为混凝土智能温控防裂,博士期间有幸全程参与了金沙江乌东德、白鹤滩水电站建设,生活中喜欢排球、羽毛球等运动。

成果展示

论文题目

混凝土实时温度数据移动平均分析方法及应用

选题缘起

为了获取大体积混凝土内部真实温度的变化过程,通常需要在混凝土内部埋设大量的温度传感器。随着技术的发展和成本的降低,温度监测的密度和频率也在增加,由于受到现场断电、断网、断线、传感器失效等因素干扰,原始监测数据中常包含着间断、缺失、突变等噪声,直接影响混凝土真实温度场的重构、温控策略与措施的精准调控。进行混凝土温度数据的分析处理,以提高数据质量是当前混凝土智能温控学科的热点研究方向之一。

论文简介

开展混凝土实时温度监测数据质量分析对于混凝土智能温控具有重要意义。本文提出了一种混凝土实时温度数据移动平均分析方法,将传统移动平均进行了多维度扩展。通过从时间、空间和质量维度对监测数据进行动态求均值,形成用于表征某一时刻、空间点、监测对象的特征温度数据,显著减小了原始监测数据中的系统误差和偶然误差,降低了数据误差给计算仿真、分析利用的影响,提高了智能温控系统的性能。

论文节选

滑动查看更多

  2021年祝语

大风起于秋毫,春雨润物无声,诚挚感谢大数据能力提升项目在促进学科交叉创新方面做出的默默贡献,也感谢各位老师给自己创造的这一宝贵学习机会和带来的在科创、实践与个人发展等方面的诸多能力提升,值此2021新春来临之际,衷心祝愿项目能越办越好,也祝福所有支持大数据能力提升项目的老师、同学、各界友人新年快乐,平安健康,牛年大吉。

侯灵犀

电机系博士生

研究方向为敏捷遥感卫星智能化技术。曾获第45届日内瓦发明展银奖,2020年“RONG”奖学金一等奖,2019年KDD Cup 比赛Regular ML Track 前5%,2018年中国高校SAS数据分析比赛第五名。

成果展示

论文题目

Integrating flexible demand response toward available transfer capability enhancement

选题缘起

博士生实践课题是“西南区域弃水问题与外送通道问题研究”,实践期间发现当地(四川省)以水力发电为主,水电厂数量多、规模差异大,省内发电、用电受季节影响明显,加上电网数据繁杂,采用大数据技术能极大提高数据收集、整理、分析的效率与准确性,因此将大数据项目所学聚类等相关知识应用到实践项目中,完成了这篇论文,最终论文被一区SCI期刊Applied Energy录用。

论文简介

论文采用聚类方法建立四川省220kV以上电网的实际模型,考虑工厂、写字楼及居民生活用电调节能力,提出计及平移型、可中断型、灵活调节型等多类需求响应的区域电网稳定外送容量优化计算模型方法。年运行实证分析表明可提升水电消纳率8.8%,减少煤耗11.6%,提升清洁能源外送12%。

论文节选

滑动查看更多

  2021年祝语

希望有更多同学了解大数据项目,学习大数据技术,提升科研能力~

李尹硕

自动化系2019级硕士研究生

男,汉族,1997年11月出生,中共党员,清华大学深圳国际研究生院自动化系2019级硕士研究生。三次获得国家奖学金、学习优秀一等奖学金,曾获优秀学生干部、省级优秀毕业生荣誉称号、清华之友-东方电气奖学金。主要研究方向为超分辨率,已发表一篇SCI一区论文、获得两项发明专利。

成果展示

论文题目

Multitask Learning for Super-Resolution of Seismic Velocity Model

选题缘起

全波形反演(FWI)是利用非线性寻优方法估算地下速度模型的有力工具,对地下资源勘探有重要价值。但实际观测到的速度资料有限,全波形反演具有计算量大、耗时久、高频细节不够清晰的缺点。因此,李尹硕在导师的带领下通过超分辨率(SR)方法提高地震速度模型的分辨率,将SR作为FWI的后处理,以提高FWI的精度与效率。地震速度模型超分辨率的主要难点是边缘恢复,因此该SR方法以地震速度模型的边缘图像作为辅助任务。

论文简介

全波形反演得到的地震速度模型可以看作是高分辨率数据经高斯或均值滤波模糊处理后的结果,缺少高频细节,边缘信息缺失明显。该项工作使用Sobel算子得到水平和数直两个方向的边缘信息,然后使用硬参数共享的多任务学习方法,同时提升地震速度模型和两个方向的边缘图像的分辨率。网络采用均方误差与全变差的组合作为损失函数,Adam作为优化器。网络采用了全局残差连接、编解码结构、稠密连接结构以提高超分辨率效果。

论文节选

滑动查看更多

  2021年祝语

在这飘雪的季节里,怀着一颗感恩的心,走进新的一年。让我们一路同行,学最好的别人,做最好的自己!

编辑:黄继彦

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值