《PhD Journey》Chapter 1 Fall 2017

本文是作者的CS博士之旅第一章,回顾2017年秋季学期。内容包括开学orientation、课程体验(Data Science Fundamentals、Algorithm Analysis、Smart Energy Computing)、助教经历以及初步接触导师。在Data Science课程中,作者通过项目和作业深入了解了DS的挑战和收获,而在Algorithm Analysis课程中,深入学习了算法理论并以A-告终。
摘要由CSDN通过智能技术生成

《CS PhD Journey》Chapter 1 — Fall 2017


前言

在开学之前,CS学院有一个orientation。在参加orientation的路上,发现自己被一群印度人包围了。这里印度人真多,CS学院80%以上的印度人。上午的orientation是MS和PhD一起,下午是MS和PhD分开。下午的时候,我看到了大部分的CS PhD,得知我这一届来自大陆的CS PhD有11个人,印度人(以及长得像印度人的巴基斯坦人等)加起来大概有二十来个,总共有四十多个人。在orientation上获取的重要数据:大概只有50%的CS PhD会最终毕业拿到doctor学位,大概有50%的CS PhD会更换最初分配的导师。

第二周开始上课,我选了三门课:CSE519 Data Sciences Fundamentals, CSE548 Analysis of Algorithms, CSE591 Topics in Computer Sciences (Smart Energy Computing)


CSE519 Data Science Fundamentals

Data Science (DS) 是非常火的一个方向,我也比较感兴趣,于是选了DS。老师是Steven Skiena,德高望重的一个老师。除了知道几个常见的机器学习(ML)算法之外,DS我几乎是零基础,这注定了这门课将会较为艰难。首先,我Python几乎不会,然而DS的作业和项目都要用Python。老师建议的编程环境是Jupyter Notebook,没有用过。还好这些东西上手都比较快。

总共有三次作业(20%),一个大Project(50%),期末考试(30%),额外奖励(10%)。

第一次作业是看DS项目视频,写感想。视频是Fall 2014 Data Science的学生做的大Project的录像,30分钟。通过看视频,大概了解DS的项目是怎么一回事了,学生遇到了什么问题,是怎么解决的。

第二次作业是Kaggle上的房地产项目。Kaggle给了一个三百万行、五十几列的CVS文件作为数据,一行就是一个房屋,一个房屋有五十几个特征(五十几列)。预测的房屋的价格和真实值的误差的对数。我按照作业的要求一步一步做,前面几个简单的问题一一解决,但是在deadline的前一天,最重要的问题(调用ML算法,得到结果,分析结果)还没有做,而且该如何做我还没有头绪。最后一天晚上,熬夜赶due。幸好抱上了大腿AWZW,他是ZXX请来的外援。AWZW给我提供了一些关键代码,最后涉险过关了。

第三次作业还是Kaggle上的房地产项目,在第二次作业的基础之上,增加了一些问题。这一次是团队合作。我找了ZXX和韩国妹子THNL三个人组队。由于这次作业的deadline和CSE548的第一次期中考试在同一天,我决定提前把我的部分做完,这样最后两天可以复习期中考试。我做的部分是设计distance function和clustering,其中前者是后者的重要组成部分。Distance function是计算两个房屋之间的距离,距离越小说明两个房屋越接近。聚类就是把相近的房屋聚成一类,

  • 6
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值