《吴恩达机器学习》笔记——11 应用机器学习的建议

最新推荐文章于 2024-02-04 21:52:27 发布

ziuno

最新推荐文章于 2024-02-04 21:52:27 发布

阅读量133

点赞数

分类专栏：笔记机器学习吴恩达机器学习

本文链接：https://blog.csdn.net/ziuno/article/details/103099977

版权

笔记同时被 3 个专栏收录

34 篇文章 0 订阅

订阅专栏

机器学习

12 篇文章 0 订阅

订阅专栏

吴恩达机器学习

8 篇文章 0 订阅

订阅专栏

                    
                    《吴恩达机器学习》笔记——11 应用机器学习的建议 
1 决定下一步做什么 
问题算法改进
产生较大误差1. 使用更多训练样本
2. 尝试选用更少特征
3. 获取更多特征
4. 增加多项式特征
5. 增大或减小 
        
            λ 
           
           \lambda 
          
       λ
 
2 模型评估与选择 
评估单个模型多个模型选择
数据集训练集(70%)
测试集(30%)训练集(60%)
交叉验证集(20%)
测试集(20%)
训练/测试1. 从训练集中学得 
        
            θ 
           
           \theta 
          
       θ
2. 计算测试误差使用交叉验证集来测试计算出 
        
             J 
            
              c 
             
              v 
             
            ( 
           
            θ 
           
            ) 
           
           J_{cv}(\theta) 
          
       Jcv​(θ)，观察效果并选择交叉验证误差最小的假设作为模型
 
3 偏差与方差 
问题类型偏差问题(bias)方差问题(variance)
来源训练误差交叉验证误差
欠拟合高高
过拟合低高
正则化 
        
            λ 
           
            ↑ 
           
            → 
           
            偏 
           
            差 
           
            ↑ 
           
           \lambda\uparrow\rightarrow 偏差\uparrow 
          
       λ↑→偏差↑ 
        
            { 
           
                 欠 
                
                 拟 
                
                 合 
                
                 ， 
                
                 高 
                
                 方 
                
                 差 
                
                 λ 
                
                 过 
                
                 大 
                
                 低 
                
                 方 
                
                 差 
                
                 λ 
                
                 合 
                
                 适 
                
                 过 
                
                 拟 
                
                 合 
                
                 ， 
                
                 高 
                
                 方 
                
                 差 
                
                 λ 
                
                 过 
                
                 小 
                
           \left\{\begin{matrix}欠拟合，高方差& \lambda过大\\低方差&\lambda合适\\过拟合，高方差&\lambda过小\end{matrix}\right. 
          
       ⎩⎨⎧​欠拟合，高方差低方差过拟合，高方差​λ过大λ合适λ过小​
 
4 学习曲线 
参数描述
 
             J 
            
              t 
             
              r 
             
              a 
             
              i 
             
              n 
             
            ( 
           
            θ 
           
            ) 
           
           J_{train}(\theta) 
          
       Jtrain​(θ) 
        
             1 
            
              2 
             
              m 
             
             ∑ 
            
              i 
             
              = 
             
              1 
             
             m 
            
            ( 
           
             h 
            
             θ 
            
            ( 
           
             x 
            
              ( 
             
              i 
             
              ) 
             
            ) 
           
            − 
           
             y 
            
              ( 
             
              i 
             
              ) 
             
             ) 
            
             2 
            
           \frac{1}{2m}\sum\limits^m_{i=1}(h_\theta(x^{(i)})-y^{(i)})^2 
          
       2m1​i=1∑m​(hθ​(x(i))−y(i))2
 
             J 
            
              c 
             
              v 
             
            ( 
           
            θ 
           
            ) 
           
           J_{cv}(\theta) 
          
       Jcv​(θ) 
        
             1 
            
              2 
             
               m 
              
                c 
               
                v 
               
             ∑ 
            
              i 
             
              = 
             
              1 
             
              m 
             
               c 
              
               v 
              
            ( 
           
             h 
            
             θ 
            
            ( 
           
             x 
            
              c 
             
              v 
             
              ( 
             
              i 
             
              ) 
             
            ) 
           
            − 
           
             y 
            
              c 
             
              v 
             
              ( 
             
              i 
             
              ) 
             
             ) 
            
             2 
            
           \frac{1}{2m_{cv}}\sum\limits^{m_{cv}}_{i=1}(h_\theta(x_{cv}^{(i)})-y_{cv}^{(i)})^2 
          
       2mcv​1​i=1∑mcv​​(hθ​(xcv(i)​)−ycv(i)​)2
 
            m 
           
           m 
          
       m训练集大小（横轴）
 
            e 
           
            r 
           
            r 
           
            o 
           
            r 
           
           error 
          
       error误差（纵轴）
 
学习曲线
 
            m 
           
            ↑ 
           
            → 
           
           m\uparrow\rightarrow 
          
       m↑→高偏差高方差
 
             J 
            
              t 
             
              r 
             
              a 
             
              i 
             
              n 
             
            ( 
           
            θ 
           
            ) 
           
           J_{train}(\theta) 
          
       Jtrain​(θ)逐渐增大 
        
            → 
           
           \rightarrow 
          
       →不再增大缓慢增大
 
             J 
            
              c 
             
              v 
             
            ( 
           
            θ 
           
            ) 
           
           J_{cv}(\theta) 
          
       Jcv​(θ)逐渐减小 
        
            → 
           
           \rightarrow 
          
       →不再减小（仍较大）
（ 
        
            ≈ 
           
             J 
            
              t 
             
              r 
             
              a 
             
              i 
             
              n 
             
            ( 
           
            θ 
           
            ) 
           
           \approx J_{train}(\theta) 
          
       ≈Jtrain​(θ)）缓慢减小
（仍与 
        
             J 
            
              t 
             
              r 
             
              a 
             
              i 
             
              n 
             
            ( 
           
            θ 
           
            ) 
           
           J_{train}(\theta) 
          
       Jtrain​(θ)有较大差距，但差距随着 
        
            m 
           
           m 
          
       m的增大减小）
 
5 决定接下来做什么 
使用问题算法改进（绘制并观察学习曲线）
高偏差3. 获取更多特征
4. 增加多项式特征
5.2 减小 
        
            λ 
           
           \lambda 
          
       λ
高方差1. 使用更多训练样本
2. 尝试选用更少特征
5.1 增大 
        
            λ 
           
           \lambda 
          
       λ

问题	算法改进
产生较大误差	1. 使用更多训练样本 2. 尝试选用更少特征 3. 获取更多特征 4. 增加多项式特征 5. 增大或减小 $\lambda$

评估	单个模型	多个模型选择
数据集	训练集(70%) 测试集(30%)	训练集(60%) 交叉验证集(20%) 测试集(20%)
训练/测试	1. 从训练集中学得 $\theta$ 2. 计算测试误差	使用交叉验证集来测试计算出 $J_{cv}(\theta)$ ，观察效果并选择交叉验证误差最小的假设作为模型

问题类型	偏差问题(bias)	方差问题(variance)
来源	训练误差	交叉验证误差
欠拟合	高	高
过拟合	低	高
正则化	$\lambda\uparrow\rightarrow 偏差\uparrow$	$\left\{\begin{matrix}欠拟合，高方差& \lambda过大\\低方差&\lambda合适\\过拟合，高方差&\lambda过小\end{matrix}\right.$

参数	描述
$J_{train}(\theta)$	$\frac{1}{2m}\sum\limits^m_{i=1}(h_\theta(x^{(i)})-y^{(i)})^2$
$J_{cv}(\theta)$	$\frac{1}{2m_{cv}}\sum\limits^{m_{cv}}_{i=1}(h_\theta(x_{cv}^{(i)})-y_{cv}^{(i)})^2$
$m$	训练集大小（横轴）
$e r r o r$	误差（纵轴）

学习曲线 $m\uparrow\rightarrow$	高偏差	高方差
$J_{train}(\theta)$	逐渐增大 $\rightarrow$ 不再增大	缓慢增大
$J_{cv}(\theta)$	逐渐减小 $\rightarrow$ 不再减小（仍较大）（ $\approx J_{train}(\theta)$ ）	缓慢减小（仍与 $J_{train}(\theta)$ 有较大差距，但差距随着 $m$ 的增大减小）

使用问题	算法改进（绘制并观察学习曲线）
高偏差	3. 获取更多特征 4. 增加多项式特征 5.2 减小 $\lambda$
高方差	1. 使用更多训练样本 2. 尝试选用更少特征 5.1 增大 $\lambda$

ziuno

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《吴恩达机器学习》笔记——11 应用机器学习的建议

《吴恩达机器学习》笔记——11 应用机器学习的建议1 决定下一步做什么问题算法改进产生较大误差1. 使用更多训练样本2. 尝试选用更少特征3. 获取更多特征4. 增加多项式特征5. 增大或减小λ\lambdaλ2 模型评估与选择评估单个模型多个模型选择数据集训练集(70%)测试集(30%)训练集(60%)交叉验证集(20%)测试集(20...
复制链接

扫一扫