ccc-Classification-李宏毅(4)

最新推荐文章于 2024-11-01 17:13:19 发布

扔出去的回旋镖

最新推荐文章于 2024-11-01 17:13:19 发布

阅读量650

点赞数

分类专栏：深度学习-李宏毅文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liubi32326/article/details/128978347

版权

深度学习-李宏毅专栏收录该内容

8 篇文章 0 订阅

订阅专栏

文章目录

Classification 概念

本质是找一个函数，输入对象X后输出其所属类别Class，实际应用如下：
在这里插入图片描述

Example Application

以神奇宝贝属性分类（Water/79 和 Normal/61）进行推进，function中input数据来源如下：
在这里插入图片描述

How to do Classification

数据通过函数中计算后返回判断类别结果，loss函数返回训练集汇总出现的错误，然后选择最优模型
idea图如下（二分类）：
在这里插入图片描述

Why not Regesssion

在这里插入图片描述
存在的问题：

回归用一条线，但问题是非常正确的样本将分界线过度纠正导致效果不好
Regression返回的是连续值，classification返回离散的点，性质不同

Probability from Class - Feature

只考虑Defense和SP Defence这两种feature，并认为样本点符合高斯分布（正态分布）注意海龟不在训练集中

高斯分布的简单介绍
公式如下：
$f_{\mu,\Sigma}(x)=\frac{1}{(2\pi)^{D/2}}\frac{1}{|\Sigma|^{1/2}}exp\{-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu)\}$
其中， $\mu$ 表示均值， $\Sigma$ 表示协方差（covariance），它们对于分布的影响如下：

不同的 $\mu$ 相同的 $\Sigma$ 概率分布最高点不同
相同 $\mu$ 不同的 $\Sigma$ ，概率最高点相同，分散程度不同

Probability from Class

将海龟的数据代入由之前的79个资料形成的高斯分布中就可以估测它所属类别的概率。通过极大似然函数寻找这个高斯分布：

在这里插入图片描述
分别计算两种类别最佳高斯分布参数：

将这些得到的数据进行代入分类公式（设定阈值0.5）：

How’s the results?

在这里插入图片描述
左图是训练集右图是测试集，结果47% accuracy，效果非常差。即使使用所有的6种数据集accuracy也仅仅54%。

Modifying Model

考虑可能是参数过多导致过拟合，比较好的解决方式是公用一个covariance matrix，因为它在样本数量较多时增长非常迅速（与feature size的平方成正比）然后造成过拟合，使用相同协方差过程如下：
在这里插入图片描述

效果得到了显著提升，并且边界变成了线性的。为什么？鬼知道！

Three Steps

在这里插入图片描述

Probability Distribution

在这里插入图片描述
sigmoid function：

在这里插入图片描述

在这里插入图片描述

上面推导解释为何分类的边界线变成了线性的

扔出去的回旋镖

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。