2018年春季《数据科学导论》课程回顾(一)

本文回顾2018年春季的《数据科学导论》课程,探讨数据科学如何继承传统数学建模并发展出工程化方法论。课程旨在帮助学生从高中数学思维转向数值计算和数学建模,强调基础功的重要性,认为数据科学在很大程度上是数学建模的现代应用,同时指出数据科学的工程化特征,如Python的Pipeline在分析流程中的作用。
摘要由CSDN通过智能技术生成

【这个帖子是总结数据科学教学体系设计和教学经验的,会有一些比较发散的议论和思考,抛砖引玉,请看官不要苛责,多提宝贵意见。因为数据科学导论课程最大的困难是,能讲的,该讲的东西太多,不知如何取舍;而且针对不同背景和先修课程的学生,内容也会存在很大差异,这些都是巨大的挑战,需要迭代改进。】

2018年春季学期要结束了,这个学期给人民大学统计学院“数据科学与大数据技术”本科专业学生开设《数据科学导论》课程,感觉头绪纷乱,压力山大。不过几个月的课程讲下来,效果似乎还可以。

本课程的目标是大一下学期学生,他们已经接触过下列课程:微积分、线性代数、概率论(高中水平)、统计学(入门课程)、编程(学了一点C语言)、最优化(求最大值最小值)。按照《深度学习》中的先修课程要求,他们可以开始自学了,如果是速成课程的话,讲几次Python,然后拿scikit-learn跑数据集,就OK了。不过这些学生的长远目标是成为专业的数据科学家,他们的学习时间至少要按照6年来设定,因此面向一年级学生的《数据科学导论》课程就不宜局限于调用API或者点按钮了,可能更需要帮助他们完成从高中数学到数值计算和数学建模的转型。高中数学的特点是应试和推公式,与现实无关,自然需要新的课程和实践来逐步扭转思维定势。

新瓶装旧酒吗?数据科学继承传统的一面

那么,将目标设定为数值计算和数学建模的原因何在,难道数据科学不是一个更漂亮的包装吗?问题在于,数据科学是什么?数据科学和数据科学家是先有鸡还是先有蛋,这些都是待定的问题。对于新生来说,他们并不需要更多的营销口号和包装&#x

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值