Andrew-Ng-ML 吴恩达机器学习 课后练习错题总结
- 4 Linear Regression with Multiple Variables
- 5 Octave/Matlab Tutorial
- 6 Logistic Regression
- 7 Regularization
- 8 Neural Networks: Representation
- 9 Neural Networks: Learning
- 10 Advice for Applying Machine Learning
- 11 Machine Learning System Design
- 12 Support Vector Machines
- 13 Unsupervised Learning
- 14 Principal Component Analysis
- 15 Anomaly Detection
- 16 Recommender Systems
- 17 Large Scale Machine Learning
- 18 Application: Photo OCR
4 Linear Regression with Multiple Variables
mean normalization 均值归一化
mean=6675.5
8836-4761=4075
(4761-4075)/6675.5 错了
(4761-6675.5)/4075=-0.47 对了
feature scaling 特征缩放
选C
一开始没看懂local optima(局部最优)和iteration(迭代),选了B
5 Octave/Matlab Tutorial
vectorization 向量化&线性代数
6 Logistic Regression
Logistic 分类
梯度下降
7 Regularization
正则化
λ过大会欠拟合
D不能选,因为λ过大反而会造成欠拟合
8 Neural Networks: Representation
神经网络
A不能选
9 Neural Networks: Learning
神经网络&梯度下降
第一次漏选了D;还以为可以波动着下降
10 Advice for Applying Machine Learning
高偏差-欠拟合-λ大了;高方差-过拟合-λ小了
·Trying smaller sets of features: Fixes high variance
·Adding features: Fixes high bias
之前记错了,没选第二个
训练集/验证集/测试集
第一次多选了D
可能应该用交叉验证集去选
11 Machine Learning System Design
判断是否需要大量数据
这个A是对的,unlikely不太可能 过拟合
欠拟合
12 Support Vector Machines
欠拟合
c也应该选
SVM(with the linear kernel)
一开始没选B
13 Unsupervised Learning
K-means适用于什么
D需要标签
14 Principal Component Analysis
PCA主成分分析适用于什么
15 Anomaly Detection
高斯分布
-3-2=-5
-3+2=-1
2*2=4
16 Recommender Systems
协同过滤什么时候用
你已经编写了一个下载许多网站里新闻文章的软件。在您的系统中,您还可以跟踪您个人喜欢与不喜欢的文章,并且系统还存储这些文章的特征(例如,单词计数、作者姓名)。使用此信息,您想要构建一个系统来尝试查找您个人喜欢的其他新文章。
不能选,这个偏向于分类
cost fuction
错了,应该选上A,m=1二者就一样了
协同过滤
C:协同过滤不需要每个人对每个电影都评分
协同过滤中R的利用
没搞懂C(R==1)会有啥效果
17 Large Scale Machine Learning
随机梯度下降stochastic gradient
不能选A,是每过500/1000计算一次
在线学习
要选B,第一次看到随机梯度下降然后没选
18 Application: Photo OCR
基于原始数据扩充数据集
本来选了ad没想到是单选,应该只选A
要选B,第一次看到随机梯度下降然后没选