回答一些课后同学提出的问题以及推荐书目
课程预备知识
- Python 基础
- Numpy
- Scipy
- Pyplot
- Pandas
- 机器学习
- 吴恩达课程
- 西瓜书
问题解答更新
2017-11-2 更新
Q: 为什么LinearRegression 的结果和基于梯度下降的结果差异很大?
A: 本次实验的数据集过小,可能造成这样的误差,如果需要在大数据集上验证,可以在Kaggle上寻找更大的数据集,例如Boston房价数据集,imdb影评数据集。
Q: 我觉得课程上所学的知识不是很够,需要补充阅读,有什么推荐的资料?
A: 目前看来Ng(吴恩达)的课程是足够的,进行课程学习,同时完成对应的实验,可以达到预期的目的
Q: 实验我们是需要做课上布置的,还是也能做犀牛学院的?
A: 实验由各位同学自行选择,在日后的课程中,大家可以选择对应实验完成,两个平台均可
Q: 本教学周的学习内容是什么?我想进行相应的预习
A: SVM和Bayes分类器(今后会在更新中发布教学周的内容,供大家预习准备)
Q: 如果训练函数是
y=θ0+θ1x1+θ2x2
,对数据进行归一化的时候,要把y也归一化吗?
A: 事实上,归一化只是让梯度下降更为平滑,改变的是损失函数之前的
θixi
部分,不需要调整真实值
yreal
Q: 实验报告中代码可以截图吗?
A: 可以
Q: 实验二运行后一直“ln[*]”不出结果,重新进入实验也不行,实验一就没问题,该怎么解决?
A: 事实上这是一种kernel busy, 理论上需要重启Jupyter Notebook,但是服务器的重启目前正在联系百度相关人员。
Q: 实验二中 没有05到15年的数据啊 只到了07年的了 后面年份的数据 该怎么弄出来呢
A: 这是本身数据集的问题,只需分好测试集和训练集就行了。