《李宏毅机器学习》task1

最新推荐文章于 2022-11-14 11:19:07 发布

程序员椰子橙

最新推荐文章于 2022-11-14 11:19:07 发布

阅读量237

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/devcy/article/details/90179510

版权

机器学习专栏收录该内容

32 篇文章 0 订阅

订阅专栏

《李宏毅机器学习》task1

1.什么是机器学习

Langley（1996) 定义的机器学习是“机器学习是一门人工智能的科学，该领域的主要研究对象是人工智能，特别是如何在经验学习中改善具体算法的性能”。

2.中心极限定理、正态分布、最大似然估计

最大似然估计

给定一堆数据，假如我们知道它是从某一种分布中随机取出来的，可是我们并不知道这个分布具体的参数，即“模型已定，参数未知”。例如，我们知道这个分布是正态分布，但是不知道均值和方差；或者是二项分布，但是不知道均值。最大似然估计（MLE，Maximum Likelihood Estimation）就可以用来估计模型的参数。MLE的目标是找出一组参数，使得模型产生出观测数据的概率最大：

其中就是似然函数，表示在参数下出现观测数据的概率。

最大似然估计的一般求解步骤

最大似然估计的一般求解过程：

（1）写出似然函数；

（2）对似然函数取对数，并整理；

（3）求导数；

（4）解似然方程

3.线性回归loss function推导

4.损失函数和凸函数之间的关系

如果损失函数是凸函数，那么一定有全局最优解，且不论初始值如何选取。

5.全局最优与局部最优

损失函数存在局部最小值，初始点选取不当，则很有可能会造成局部最优解。

6.学习导数，泰勒展开

泰勒展开式

7.推导梯度下降公式

8.写出梯度下降的代码

9.学习L0 L1 L2

10.推导正则化公式

11.说明为什么用L1代替L0

12.为什么只对w0做限制，不对b做限制

程序员椰子橙

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。