ML
文章平均质量分 85
system991106
计算机在读学生,一起加油。
展开
-
ML学习笔记b站吴恩达(10-12/19)
同理当选取了较好的分界线时,p superscript i就比较大一点,那么theta范数也就达到了尽量小的目的。总结地来看,当decision boundary的附近样本点尽可能少时,p superscript i就可以尽可能的大,此使theta范式就可以尽可能的小,此时1/2 * theta范式的平方也就是目标函数值就能尽可能的小,也就是选取了较好的decision boundary,达到了优化的目标,这时候出现的现象也就是large margin classifier。原创 2023-10-22 13:19:06 · 82 阅读 · 1 评论 -
ML学习笔记b站吴恩达(7-9/19)
Theta过大会导致惩罚程度太大,参数都倾向于零,就相当于几乎把参数都变成0只剩下theta0,这样就得到的是一条直线,就欠拟合了,或者说这个假设模型has a strong preconception或者说high bias。梯度检测用的代码计算量是非常大的,所以确认反向传播没有问题就要把梯度检测关掉,反向传播比梯度检验要快很多,不及时禁用梯度检验代码,程序运行会非常慢。向量表达式的好处是,有相关矩阵,使用一些高级的优化算法时,这些算法通常会要求参数展开成一个长向量的形式。原创 2023-09-29 19:12:16 · 70 阅读 · 0 评论 -
ML学习笔记b站吴恩达(1-3/19)
Dimension of martix矩阵维数 number of rows x number of columns 4x2 4行2列 4by2。Cost function 代价函数 J函数 squared error cost function 平方误差代价函数。没有逆矩阵的矩阵:Singular matrix 奇异矩阵 degenerate matrix 退化矩阵。alpha学习率 alpha大梯度下降迅速 alpha小梯度下降缓慢。update simultaneously 同时更新,同步更新。原创 2023-08-08 11:10:09 · 72 阅读 · 0 评论