大数据能力提升项目| 学生成果展系列之三

导读

 

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

回首即将过去的2020年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自12个院系的16位同学代表一起领略他们的风采吧!

丁文泽

生命学院博士研究生

研究方向为生命科学与计算信息科学的交叉方向,主要是蛋白质结构的预测。在博士期间发表多篇科研论文,同时参与一定的社会活动,如前往地方政府挂职锻炼、参与微软亚洲研究院的实习等。爱好是读史和运动。本次获得了清华大学大数据能力提升项目RONG奖学金特等奖。

成果展示

论文题目

DeepConPred2: an improved method for the prediction of protein residue contacts

选题缘起

避免耗时耗力的结构解析实验,从序列直接预测蛋白质的结构,这一构想随着计算机计算能力的提升以及大规模数据处理技术的发展逐渐成为可能。此论文从蛋白质残基接触角度入手,应用深度信念网络、残差网络,提出了分级的、模块化的网络架构方法,对蛋白质残基接触情况进行预测,在严密的评价体系下,该方法的表现足以踏入同领域在当时的世界领先水平。

论文简介

蛋白质结构在诸多领域都十分重要,随着计算机技术的发展,如何避免耗时耗力的结构解析实验,而从蛋白序列直接精确地预测蛋白结构,无论是在蛋白质折叠理论还是蛋白结构应用的角度都十分值得研究;蛋白质残基接触图谱可以在构像空间搜索时提供大量高质量的空间约束,大大降低搜索成本,提高搜索精度。在蛋白质结构预测领域,以残基接触为切入点的研究越来越受到关注,成为主流方法之一。DeepConPred2 应用了分级架构,汲取了经典神经网络架构如深度信念网络,残差网络等的优点,大大降低了以往预测图谱信噪比低的问题,在严格的测试体系下,DeepConPred2的预测精度达到了同时期的国际领先水平。

论文节选

滑动查看更多

  2021年祝语

大数据能力提升项目是切实帮助清华大学的研究生提升自己的好项目,希望项目越办越好,有更多的同学受益!同时,也祝愿丁文泽同学在2021年一切顺利!

赵瀚森

化学系分析化学专业博士生

博士期间主要关注于分析化学检测与数据分析技术的交叉融合,包括显微图像的识别,追踪与分类,质谱谱图分析,质谱数据库及检索方法等相关内容。爱好编程,游戏和美食。

成果展示

论文题目

Estimate Metabolite Taxonomy and Structure with a Fragment- Centered Database and Fragment Network

选题缘起

代谢组学检测在精准医疗和分子生物学研究中具有重要的意义。通常,我们可以使用质谱检测代谢小分子的核质比信息,但如何从核质比信息追溯到具体的生物分子是目前的一个瓶颈问题。我们在整理数据时候的意外发现:本应具有一致性的二级质谱谱图,在不同样本的检测中,呈现出显著的差异性。这表明这些谱图可能是多个分子同时碎裂的结果。现有的数据库的检索算法无法帮助我们查明谱图中具体包含哪些分子。为此,我们发展和建立了一个全新的数据库MSFragDB。

论文简介

质谱图谱的分子溯源是制约基于质谱的代谢组学研究发展的重要瓶颈。尽管目前质谱检测技术持续发展,但是只有将质谱图谱信息转化为具体生物分子,我们才能在分子层次进行科学研究。我们发展了基于分子碎片的质谱图谱比对解析的算法,并重新整理HMDB数据库的数据,构建了MSFragDB。对比实验表明,尽管基于同一组数据,MSFragDB在测试样例中的表现显著的好于HMDB。

论文节选

滑动查看更多

  2021年祝语

2021年我将毕业和走向工作岗位,希望在人生的转折之年能不忘初心,充满信心和希望的走向人生新阶段。

慕海昕

新闻与传播学院2018级硕士研究生

研究兴趣为社交媒体、性别研究。已发表中文论文两篇,英文T类国际会议论文一篇。曾任清华大学新闻与传播学院研究生分会主席,曾获清华大学综合一等奖学金、清华大学优秀学生干部等荣誉。

成果展示

论文题目

Anatomy of a buzzword: Three meanings of “Chinese pastoral feminism” in social media

(解剖流行词汇:“中华田园女权”在社交媒体中的三种含义)

选题缘起

随着社交媒体掀起女性主义思潮,“中华田园女权”成为一个流行词汇,它有强烈的负面意义,常常在对某些观点、主张、甚至是行动进行批评时作为标签,但却始终没有公认的定义。在大数据课程学习中,我掌握的自动文本分析方法为了解社交媒体用户在使用这一词汇时对其进行定义的方式提供了可能。

论文简介

研究爬取了知乎中三个“何为中华田园女权”问题的约1500条回答,并对答案文本进行了主题模型分析。分析显示,社交媒体用户所认为的“中华田园女权”具有三种含义:在无关议题中过度使用性别框架,争取权利但拒绝责任,某种程度上的厌男症;研究采用罗兰·巴特的神话理论对每种含义的外延(denotation)及其相应的内涵(connotation)进行了阐释。文章指出,这一话语是新自由主义为数字女性主义带来风险的一个表征:一方面,作为男性中心主义的指意体系的持久幻想,这是对中国女性主义的扭曲和污名;同时,它宣示了女性主义内部的分野,使用者将自身合法化为真正的女权主义者。

论文节选

滑动查看更多

  2021年祝语

大数据项目的完成对我来说是新的开始,希望未来我能在数据能力提升的道路上探索属于自己的更多可能;也祝愿大数据项目越办越好,为更多同学提供打开新世界大门的钥匙。

王瑜琪

教育研究院2018级博士生

主要研究方向为研究生教育,入学至今,已在多个课题组参与相关研究工作,并发表CSSCI论文多篇。今后,将继续专注于研究生教育,探讨其与经济社会发展的关系,并尝试为其发展提供建议。

成果展示

论文题目

研究生教育规模对经济增长影响的实证研究——基于国别面板数据

选题缘起

人力资本是经济增长的核心要素之一,而教育是形成人力资本的重要途径。研究生教育,是培养高层次人才的主要途径,一直以来都被认为对国家或区域经济增长有着突出的贡献,也获得了世界各国较多的关注与投入。随着研究生教育规模的扩张,其多层次、多类型特征愈发突出,对经济增长的作用也需要更为精确的识别,有必要通过实证研究进行分析。

论文简介

本文基于国别面板数据,实证分析了研究生教育规模对国家经济增长的影响,并与本专科教育规模的经济贡献进行了对比。最终发现,本专科教育、研究生教育规模对经济增长都有显著的正向影响;对于收入较低的国家,本专科教育规模对经济增长的贡献更加显著,对于收入较高的国家,研究生教育规模对经济增长的贡献更加显著;硕士教育与博士教育均显著促进经济增长,且短期内硕士教育的贡献更大,博士教育的促进作用随着时间的推移逐步增大。

论文节选

滑动查看更多

  2021年祝语

艰难方显勇毅,磨砺始得玉成。

尤静媛

2018级临床医学院与航院联合培养硕士生

2014级清华航天航空学院本科生,2018级临床医学院与航院联合培养硕士生在读。研究方向为人工智能助力睡眠医学,成功开发睡眠呼吸暂停uppp疗效预测软件,并多次参加国际学术会议,获得2019年清华大学研究生“清峰”前置式奖学金。

成果展示

发明创造名称

一种高血压风险预测方法及装置

选题缘起

在大数据能力提升项目中,我在“模式识别”和“深度学习”课程中学习到了深度学习的相关知识,掌握了一定的编程能力。因此,我将深度学习应用到研究的课题中并申请了专利。

专利简介

本发明专利为基于深度学习的针对睡眠呼吸暂停(OSA)患者的高血压风险预测方法及装置,该方法是从临床参数、血氧信号和功率谱特征中自动提取出相关特征,无需经过人工提取和处理特征即可得到高血压预测结果,大大减少了人工误差,进一步提高了OSA患者的高血压预测精度和效率。

论文节选

滑动查看更多

  2021年祝语

撕去2020年旧的篇章,翻开2021年新的一页。愿每一份耕耘都有收获,望每一次坚持都有成长。祝愿大数据能力提升项目未来带给同学们更多的惊喜和成长!

编辑:黄继彦

校对:汪雨晴

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值