《大数据系统基础》实践项目期末答辩顺利举行 校企联手打造精品实践项目见真章


近期,由清华大学研究生院和数据科学研究院(以下简称:数据院)共同开设的清华大学大数据能力提升项目《大数据系统基础》实践项目期末答辩在清华大学六号教学楼顺利举行。20位企业导师作为评审参与答辩成绩评分,他们的评分与数据院副院长、授课教师王建民和授课教师徐葳拥有同样的比重,企业导师和授课教师从数据思维的运用、分析工具使用的成熟度、项目成果质量等方面分别考察一个学期以来同学们的学习、实践成果。


回顾过去的四个月,提供课程实践项目的企业和跨学科组队共同完成项目的学生在相互的沟通磨合之中一起成长进步。去年9月,数据院面向对数据分析技术有实际需求的企业为该课程广泛征集实践项目,社会反响强烈。随后数据院针对报名企业组织了项目征集答辩会,近30家企业代表纷纷登上讲台从各自的企业情况、项目背景和需求三方面做了简要介绍。经过选课学生和授课老师的激烈“择选”,最终21个项目入选该课程。经过11月中期答辩的考验和锤炼期中答辩报道,同学们对授课老师和企业导师针对性的点评和指导进行了充分的消化吸收,本次期末答辩同学们的表现可圈可点,王建民老师表示:“与期中答辩相比,可以看出同学们利用工具进行数据分析的水平显著提高,这离不开团队成员的相互协作,更离不开企业导师的大力支持,感谢大家对这门课的付出。”


各小组代表答辩中


三尺讲台,各组纷纷彰显“真功夫”


期末答辩是对同学们《大数据系统基础课》实践项目最终成果的考核,考察同学们是否能很好地将大数据理论知识的积累转化为项目的实践能力,做项目的过程中同学们运用所学知识,在企业导师的指导下也取得了一定的成果。李宣静同学是天津瑞能电气“风机故障检测”项目组的主要答辩人,她表示:“我们都是第一次接触实际的风机故障识别问题,对业务的理解是我们遇到的第一个挑战。当时企业没有数据监测平台来实现产品的全生命周期管理,对于没有业务背景的我们来说,做工作等同于‘盲人摸象’。这是我们遇到的第二个挑战,也是机会切入点。”随着对企业需求的充分了解,小组同学决定从挖掘风机运行数据下手获取业务经验。他们利用卷积神经网络和2014年诞生的专注于梯度提升算法的机器学习函数库XGBoost,整合了192类故障及发生频次,最终实现了故障自动诊断分析识别和风机发电功率预测等功能,并搭建了风机状态监测平台(监测平台:http://101.5.211.17:8000/index/),实现了故障自动诊断分析识别和风机发电功率预测等功能。


来自工业工程系的王明哲同学所在的由艾漫数据提供的“自然语言处理技术在文娱行业应用”项目组。他坦言:“我们组的同学来自工业工程系、机械工程系、微电子系等,没有一位人文社科专业背景的同学。平时接触的工业企业居多,这个来自文娱行业的项目对我们来说也是一个很大的挑战。”基于深厚的理工科背景,他们迅速在本学期内学习了文娱行业的基本运营规律,并且第一次尝试在实践中应用自然语言处理技术。他们采用深度网络与传统词典及规则集相结合的业内目前最先进的算法模型,建立了基于语句级标注训练的模型,目前模型精度为75%左右(预计模型极限精度为80%左右);随后,小组同学紧跟热点,选择研究了奚梦瑶维密秀摔倒事件前后共计10天的微博评论,对数据进行处理并进行可视化的展示,完成了对目标明星、品牌的网络美誉度分析和社交媒体爬取的舆情数据分析。


企业导师和任课老师认真听取汇报


跨学科组队,优势互补,充分协作


每个答辩小组都是由AB班(A班:非信息类学生,B班:信息类学生)学生共同组队完成,跨学科和跨专业的学习也是该课程实践项目的一大特色。组内同学根据自己的优势,分工各有不同。来自医学院A班的崔曦雯同学所在的小组完成的是人人贷公司提供的《基于手机通讯录的欺诈检验》项目,“企业方的邱老师为我们的项目推进付出了很多精力,详细分析了我们并不太了解的互联网金融行业的现状及发展趋势。我们A班的同学逐渐将项目需求和思路明确下来,并与B 班同学进行了背景调研并对研究采用的技术路线进行了探讨,在B班同学带领下我们进行了关于graph embeding以及概率传播的尝试,过程中也遇到了数据量过大导致的计算缓慢、可视化方案设计与制定等实际问题。在合作过程之中,我确实发现A班和B班同学不同的长处。A班的同学擅长了解客户需求、发现业务痛点、确定项目方向。B组同学擅长工程实现。我们意识到,A班同学提出的需求不是都会被B班满足,但大家总能在协作中完成任务。整个学期下来,大家都收获了真实环境下做项目的协作方法,更能体会到企业里产品经理岗和技术岗的协作经验。这些经验对我们将来走入工作岗位太有帮助了!”崔同学有感而发。


“实践出真知”,企业导师为同学们点赞


在大数据系统基础这门课上,同学们不但掌握了大数据管理的工具平台、开发环境和基本原理,培养了数据思维,应用创新能力也得到了显著提升,同学们的表现更是得到了企业导师的充分肯定。百度项目的企业导师孙光明表示:“在扎实的数据技术能力之外,让我们十分惊喜的是同学们敏锐的数据洞察力。他们对脱敏样本数据进行分析后,最终迅速锁定‘基于搜索数据做信息推荐系统’这一选题,使我印象非常深刻。因为这个选题正好恰恰是契合了互联网行业‘信息分发2.0’时代的核心。同学们的项目答辩给我在日后的业务布局中也提供了一种非常新颖的思路。非常惊叹于学生们敏锐的视角,也感谢数据院提供平台,能让我接触90后的想法,我非常受启发。”


企业导师、国家发展改革委员会城市和小城镇改革发展中心智慧城市所所长黎明讲到:“在本次合作项目中,来自建筑、电气等不同背景的同学们利用各自的专业知识,以大数据技术手段对北京市内的充电网络进行了较为客观精准的评价。同学们所做的工作为今后北京市乃至全国范围内的充电网络规划评价体系构建奠定了初步解决基础。


企业导师也对课程实践项目给出了建设性的意见,比如对于项目的规划和整体推进要更具计划性、提前拟定进度表,督促项目组分阶段推进等。


数据科学研究院始终致力于突破传统的教学方式,在大数据能力提升项目中运用更好的、更让学生接受的方式传递数据理念和技术知识。在《大数据系统基础》课中引入来自业界的真实数据和项目正是成功探索之一。本课程将信息类和非信息类的学科组队,以团队的形式做项目,使得跨学科的学生在组内进行充分交流、互相学习、各自发挥专长。课程引入20多个丰富又真实的企业数据并让学生和用户进行交流,使学生在进入职场之前就有机会了解社会和企业对大数据技术解决问题的需求。其项目数量之多、企业支持力度之大,是全国乃至世界少见的教学模式探索,收效颇丰。


校企师生答辩后合影


《大数据系统基础A/B》课程简


本门课程重点介绍大数据管理的工具平台、开发环境、基本原理。使得学生熟悉典型大数据工具与平台的特性,掌握大数据处理的基本开发方式,巩固和加深大数据分析的基础知识。 本课程的主要内容包括: 大数据软件栈、虚拟化、系统管理、数据清洗、数据存储、处理框架、内存计算、文档数据、NoSQL/NewSQL数据库、图数据、流数据、分析框架、数据分割、以及一致性。


本门课程主要希望通过对一系列与大数据相关的计算机系统知识的学习和动手实践,让学生理解大数据分析系统的软硬件架构,了解目前可用的工具和技术上存在的挑战。考虑到A班学生群体中有相当多的经管、社科及公共管理专业学生,A课程注重讲授大数据系统工具的概念、应用场景以及商业价值。B班学生群体以信息类专业学生为主,注重讲授大数据系统的原理、开发及实现。在介绍典型系统工具使用的基础上,通过分析其实现原理与设计理论,增强学生大数据平台与工具的应用与开发能力。培养学生在工作中应用与选择适合大数据工具的能力,同时也为有志于继续深入学习大数据专业课程的学生创造基础。


校对:林亦霖

为保证发文质量、树立口碑,数据派现设立“错别字基金”,鼓励读者积极纠错

若您在阅读文章过程中发现任何错误,请在文末留言,或到后台反馈,经小编确认后,数据派将向检举读者发8.8元红包

同一位读者指出同一篇文章多处错误,奖金不变。不同读者指出同一处错误,奖励第一位读者。

感谢一直以来您的关注和支持,希望您能够监督数据派产出更加高质的内容。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
│ docs.rar │ 免责声明.txt │ 抓取档目录结构.txt │ 课程介绍及抓取说明.txt │ 课程封面图-大数据系统基础(自主模式).jpg │ 课程简介-大数据系统基础(自主模式).mp4 │ ├─1. 绪论 │ 0 什么是大数据.mp4 │ 1 大数据典型应用.mp4 │ 2 大数据的特点.mp4 │ 3 大数据技术体系.mp4 │ 4 大数据生态系统.mp4 │ 5 大数据技术挑战.mp4 │ 6 课程内容.mp4 │ ├─2.云计算 │ 0 2.1大数据和云计算关系概述.mp4 │ 1 2.2并行化理念.mp4 │ 10 2.11网络虚拟化:软件定义网络.mp4 │ 11 2.12软件定义网络实现.mp4 │ 12 2.13存储虚拟化:用户接口.mp4 │ 13 2.14存储虚拟化:分布式存储实现方式.mp4 │ 14 2.15虚拟化技术总结.mp4 │ 15 2.16OPENSTACK.mp4 │ 16 2.17云计算小结.mp4 │ 2 2.3规模经济理念.mp4 │ 3 2.4从仓库规模计算机到云.mp4 │ 4 2.5云计算商业模式概述.mp4 │ 5 2.6云计算带来的价值.mp4 │ 6 2.7云计算的分类.mp4 │ 7 2.8虚拟化技术概述.mp4 │ 8 2.9计算虚拟化.mp4 │ 9 2.10网络虚拟化:基础.mp4 │ ├─3.文件存储 │ 0 Video.mp4 │ 1 Video.mp4 │ 10 Video.mp4 │ 11 Video.mp4 │ 12 Video.mp4 │ 13 Video.mp4 │ 14 Video.mp4 │ 15 Video.mp4 │ 2 Video.mp4 │ 3 Video.mp4 │ 4 Video.mp4 │ 5 Video.mp4 │ 6 Video.mp4 │ 7 Video.mp4 │ 8 Video.mp4 │ 9 Video.mp4 │ ├─4. 处理框架 │ 0 4.1大数据的处理框架.mp4 │ 1 4.2MapReduce编程模型.mp4 │ 10 4.11Pig Latin 实现与优化.mp4 │ 11 Pig Latin 实现与优化(2).mp4 │ 12 4.13类似框架.mp4 │ 13 4.14章节总结.mp4 │ 2 MapReduce执行过程.mp4 │ 3 4.4MapReduce数据流.mp4 │ 4 4.5MapReduce性能优化与容错.mp4 │ 5 4.6Hadoop.mp4 │ 6 4.7MapReduce总结.mp4 │ 7 4.8Pig Latin.mp4 │ 8 4.9Pig Latin语法.mp4 │ 9 4.10Pig Latin 嵌套数据类型.mp4 │ ├─5.内存计算 │ 0 5.1内存计算概述.mp4 │ 1 5.2并行计算挑战.mp4 │ 10 5.11大数据并行系统.mp4 │ 11 5.12Spark编程接口.mp4 │ 12 5.13Spark编程实例——Log挖掘.mp4 │ 13 5.14Spark编程实例——WorkCount.mp4 │ 14 5.15Spark实现技术.mp4 │ 15 5.16复杂的DAG示例.mp4 │ 16 5.17RDD性能的提高.mp4 │ 17 5.18Spark应用和生态环境.mp4 │ 18 5.19Spark的局限性.mp4 │ 2 5.3并行计算的局限性.mp4 │ 3 5.4大数据处理并行系统.mp4 │ 4 5.5内存计算需求.mp4 │ 5 5.6MapReduce文件传递数据.mp4 │ 6 5.7内存计算的可行性.mp4 │ 7 5.8内存层次的延迟.mp4 │ 8 5.9内存计算实例-spark.mp4 │ 9 5.10SPARK-RDD.mp4 │ ├─6. NoSQL │ 0 NoSQL与Cassandra.mp4 │ 1 数据模型、接口、语言.mp4 │ 2 系统架构与Gossip协议.mp4 │ 3 一致性哈希与数据分区.mp4 │ 4 数据副本及一致性.mp4 │ 5 节点本地数据存储.mp4 │ └─7. 流计算 0 Video.mp4 1 Video.mp4 2 Video.mp4 3 Video.mp4 4 Video.mp4 5 Video.mp4 6 Video.mp4 7 Video.mp4 8 Video.mp4 9 Video.mp4
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值