论文精读：Deep Neural Decision Trees

最新推荐文章于 2023-12-31 01:40:32 发布

王改改

最新推荐文章于 2023-12-31 01:40:32 发布

阅读量1.2k

点赞数 2

分类专栏：论文精读深度学习文章标签：神经网络 pytorch 机器学习深度学习 tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Day_20/article/details/109503099

版权

本文介绍了Deep Neural Decision Trees（DNDT）的原理，包括软分箱函数、决策树构建和学习过程。软分箱函数利用Softmax激活函数将输入映射到区间，Kronecker乘积用于构建决策树结构。实验表明，DNDT在某些数据集上的表现略优于普通神经网络，但在高维数据中存在扩展性问题。

摘要由CSDN通过智能技术生成

Deep Neural Decision Trees

Soft binning function

Soft binning function 这个函数的功能为：输入一个标量 $x$ ，生成标量 $x$ 属于的区间的索引。具体如何实现的呢？往下看：

假设我们有一个连续的变量 $x$ ，我们想把它分隔成 $n + 1$ 个间隔。这样就需要 $n$ 个切割点（cut points），这 $n$ 个切割点是可以训练的变量。将 $n$ 个切割点记做 $β_1, β_2, . . . , β_n]$ ，并且 $β_1 < β_2 < ··· < β_n.$

我们用 Softmax 作为激活函数构造一个单层神经网络:
$π = f_{w,b,τ}(x) = softmax((wx + b)/τ )$
这里的 $w$ 是常量而不是可以训练的变量。将 $w$ 的值记为: $w = [1, 2, . . . , n + 1]. $ $b$ 记作：
$b=[0,−β_1,−β_1 −β_2,...,−β_1 −β_2 −···−β_n].$
并且 $ τ > 0$ 是一个系数. 当 $τ \to 0$ 时输出趋向于一个 one-hot 向量。

举个栗子：假设有三个连续的 logits ： $o_{i−1}, o_{i}, o_{i+1}$

最低0.47元/天解锁文章

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。