1.1.5. Elastic-Net (弹性网络)与 1.1.6. Multi-task Elastic-Net(多任务弹性网络)

1.1.5. Elastic-Net

相对于之前的几章,弹性网络显得相对简单的多。不过借着弹性网络,我正好了解了一下机器学习算法里很常见的“对偶的概念”。

一、简介

在这里插入图片描述

我们知道Ridge和Lasso是有弊端的:

  • Ridge虽然很稳定,但是因为对参数(特征)没有进行筛选,所以样本一大,特征一多,模型复杂度就直线上升
  • Lasso依靠嵌入式特征选择,拥有相当优秀的抗过拟合的能力。不过也是因为它的稀疏性,它不太稳定。毕竟特征一少,遇到样本远多于特征的情况时,模型很容易就崩了

所以,遇到这样的问题,我们和容易想到将Ridge和Lasso,即带有 l 1 l_1 l1 l 2 l_2 l2范数的模型,做一个结合。

在这里插入图片描述

我们可以看出,弹性网络不仅具备Lasso的稀疏性,也同时具备Ridge的稳定性,效果十分突出。

二、目标函数

min ⁡ w 1 2 n s a m p l e ∥ X w − y ∥ 2 2 + α ρ ∥ ω ∥ 1 + α ( 1 − ρ ) 2 ∥ ω ∥ 2 \min\limits_{w} \frac{1}{2n_{sample}}\parallel\mathit{Xw} -\mathit{y}\parallel_2^2+\alpha\rho\parallel\omega\parallel_1+\frac{\alpha(1-\rho)}{2}\parallel\omega\parallel_2 wmin2nsample1Xwy22+αρω1+2α(1ρ)ω2

哎呦我去,打这一行公式可不容易,没把我累死。

介绍一下这几个参数是啥意思

  1. α \alpha α:学习率,没啥好说的,对两个正则项都一样,是控制正则化程度的
  2. ρ \rho ρ:这个大家就不用想太多,它代表的是 l 1 l_1 l1范数与 l 2 l_2 l2范数的比值。所以 l 1 l_1 l1范数前面乘上了系数 ρ \rho ρ l 2 l_2 l2范数前面乘上了系数 1 − ρ 1-\rho 1ρ
  3. l 2 l_2 l2范数前面的系数多了个 1 2 \frac{1}{2} 21,其用处和ridge那一章讲的一样,是为了便于计算,没有什么特殊的意义。

三、对偶间隙

想到要了解这个是因为sklearn里的一句话

在这里插入图片描述

这里简单介绍一下对偶的思想(事实上,我也没太整明白)
这个可以参照知乎的这个问题,感觉它讲的蛮清楚的。

  1. 目的:求B条件下A的最小值(我们有A的点集,想找点满足B的A当中最小的那个)
  2. 我们找到一个跟A高度相关,但是有跟B有关系的变量C,我们参照拉格朗日数乘求条件极值的形式把它写成C = kB+A。
  3. 我们通过这个C,从下往上(从小到大)去逼近A的点集(方程代表),目的是找到唯一满足条件的A使得C最大(几何意义表现为相切)。
  4. C最大,意思是在花费很小的条件满足B的情况下,找到最小的A(因为逼近与相切)
  5. 这种情况下,找到的A即为对偶关系的解。

通常来说,如果A的点集是凸的,我们找到的A就是最小值;但是很多时候,因为逼近点集时,我们会受到其它不符合条件,但值又很小的点的干扰,所以我们所求的解和最优解之间会存在间隙(即duality gap对偶间隙)

如果对偶间隙太大,但我们要求的间隙(这里可近似理解为误差)要尽可能小,所以模型有时会不收敛。所以我们要权衡一下“收敛”和“间隙”的关系。

1.1.6. Multi-task Elastic-Net

在这里插入图片描述

Multi-task Elastic-Net是弹性网络在多任务学习领域的推广

有关多任务学习的介绍具体可参照Multi-task Lasso一章。

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: canal.adapter-1.1.5.tar.gz是一个压缩文件,通常被用于分发和安装软件。根据文件名来推测,这个文件很可能与canal.adapter软件的版本1.1.5有关。canal.adapter是一个用于数据同步和实时数据抽取的开源工具,可以将数据库中的变更数据实时地推送到其他系统进行处理和分析。 .tar.gz是一种常见的压缩文件格式,.tar表示将多个文件或目录打包成一个.tar文件,.gz表示对.tar文件进行gzip压缩。所以canal.adapter-1.1.5.tar.gz文件首先需要进行解压缩,才能使用其中的内容。解压缩这个文件的方式可以使用命令行工具如tar或7-Zip等软件。 解压缩后,我们可以看到其中可能包含有源代码、库文件、配置文件等相关文件。这些文件可以根据需要进行调整和配置,以便正确地运行和使用canal.adapter工具。 使用canal.adapter-1.1.5.tar.gz文件,我们可以在项目中使用最新版本的canal.adapter来进行数据同步和实时数据抽取的开发。可以通过编译源代码、配置相关参数和引入依赖等步骤,将canal.adapter集成到我们的项目中,从而实现实时的数据库数据同步功能。 总之,canal.adapter-1.1.5.tar.gz是一个压缩文件,与canal.adapter软件及其版本1.1.5相关。它是一个用于数据同步和实时数据抽取的工具,通过解压缩并进行相关配置,我们可以在项目中使用这个工具实现数据库数据的实时同步。 ### 回答2: canal.adapter-1.1.5.tar.gz 是一个文件的压缩包。其中 canal.adapter 是一个数据传输工具,可以与 Canal 进行配合使用。Canal 是阿里巴巴的一个开源项目,用于实时同步 MySQL 或者 PostgreSQL 数据库的数据到消息队列或者其他存储中。 通过解压 canal.adapter-1.1.5.tar.gz 文件,我们可以获得 canal.adapter-1.1.5 文件夹,其中包含了 canal.adapter 的相关文件和配置。 在使用 canal.adapter 进行实时数据同步时,我们可以根据不同的业务需求进行配置。主要的配置文件包括 instance.properties 和 adapter.properties。instance.properties 用于配置与数据库的连接信息,如数据库的地址、端口、用户名和密码等。adapter.properties 则可以配置数据同步的规则,包括指定要同步的数据库、表以及需要传输到的目标存储等。 下载并安装 canal.adapter-1.1.5 版本后,我们可以使用命令行或者配置启动脚本来启动 canal.adapter。启动后,canal.adapter 将会根据配置规则进行数据同步。当数据库中的数据发生变化时,canal.adapter 将会将变更的数据发送到指定的消息队列或者存储,以供其他应用程序使用或者分析。 可以说,canal.adapter-1.1.5.tar.gz 提供了一个方便可靠的数据传输工具,可以帮助开发者实现数据库数据的实时同步,方便数据的处理和利用。 ### 回答3: canal.adapter-1.1.5.tar.gz是一个压缩文件,通常用于存储和传输文件。根据后缀名.tar.gz,我们可以推断这是一个使用tar和gzip算法进行压缩的文件。 Canal.adapter-1.1.5.tar.gz的具体内容无法确定,因为它只是一个文件的名称。它可能是一个软件包、库文件或其他类型的文件。 Canal.adapter-1.1.5.tar.gz可能是Canal Adapter的一个版本,Canal Adapter是一种用于数据同步的工具。Canal Adapter提供了通过Canal获取MySQL数据库的更新事件,并将其转发到其他存储、消息队列或分析系统的能力。 .tar.gz是一种常见的压缩文件格式,在Linux和Unix系统中被广泛使用。通过解压tar.gz文件,我们可以得到原始的文件或文件夹。 要解压.tar.gz文件,可以在命令行中使用常见的解压工具,例如tar命令。我们可以使用以下命令进行解压: ``` tar -zxvf canal.adapter-1.1.5.tar.gz ``` 解压后,我们可以在适当的目录中找到相应的文件。进一步操作取决于该文件的用途和目的。 需要注意的是,300字的篇幅非常有限,上述回答只是对Canal.adapter-1.1.5.tar.gz进行的初步猜测,并不能提供关于该文件的详细信息。如需进一步了解,建议查看相关文档或咨询相关的技术人员。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值