浅析SAE与DBM(Deep Learning)

SAE与DBM两个都可以用于提取输入集特征。

SAE

SAE是由多个Spase AutoEncoder堆叠而成,单个Spase AutoEncoder的结构如下:

在堆叠成SAE时的结构如下:

以上SAE的结构可以化分为两个sparse autoencoder和一个 softmax(这里不讨论softmax).其中的两个sparse autoencoder结构如图:
第一层:
第二层:
在训练SAE的时候,也是一层一层的进行训练,首先将原始数据输入训练第一层sparse autoencoder,获得了第一层的features(也就是训练获得的参数权重W1和偏置b1),而后根据:
z2 = W1*data+repmat(b1,1,m);
activation = sigmoid(z2);
获得activation作为输入训练第二层sparse autoencoder,以此类推。

DBM

DBM可以说是由多个RBM叠加起来的(注意与DBM的区别)。
DBM由多层神经元构成,这些神经元又分为显性神经元和隐性神经元(以下简称显元和隐元)。显元用于接受输入,隐元用于提取特征。因此隐元也有个别名,叫特征检测器 (feature detectors)。最顶上的两层间的连接是无向的,组成联合内存 (associative memory)。较低的其他层之间有连接上下的有向连接。最底层代表了数据向量 (data vectors),每一个神经元代表数据向量的一维。
DBM 的组成元件是受限玻尔兹曼机 (Restricted Boltzmann Machines, RBM)。训练 DBM 的过程是一层一层地进行的。在每一层中,用数据向量来推断隐层,再把这一隐层当作下一层 (高一层) 的数据向量。

RBM 的训练过程,实际上是求出一个最能产生训练样本的概率分布。
RBM:

总结

sae是非线性变换找到主特征方向,而dbm是基于样本的概率分布来提取高层表示。两者的的基本单元sparse autoencoder和rbm的基本原理是不同的。训练方法上,sae一般用梯度下降方法,而dbm则是kl散度。sae和dbm训练的整体流程都是一致的,都是一层一层进行训练。

XGBoost是一种强大的机器学习算法,它可以用于回归和分类问题,并且在许多数据科学竞赛中表现出色。在XGBoost中,特征的重要性是指特征对模型预测能力的贡献程度。了解特征的重要性可以帮助我们理解哪些特征对于预测结果更为关键。 在XGBoost中,特征的重要性可以通过计算特征的增益(gain)来评估。增益是解释每个特征的相对重要性的最相关属性。具体来说,XGBoost使用了一种基于树模型的算法来计算特征的增益。在XGBoost的源码中,可以看到使用增益来进行特征重要性判断的过程。 要从XGBoost模型中访问和绘制特征的重要性评分,可以使用XGBoost提供的函数。例如,可以使用`get_score`函数来获取特征的重要性评分,并使用可视化工具(如matplotlib)将其绘制出来。这样可以更直观地了解哪些特征对于模型的预测能力更为重要。 在使用XGBoost模型进行特征选择时,可以根据特征的重要性进行筛选。可以选择保留重要性较高的特征,或者根据自己的需求设定一个阈值,只保留重要性超过该阈值的特征。这样可以减少特征空间的维度,提高模型的效率和泛化能力。 对于小型数据集,使用交叉验证作为模型评估方案可能是一种更有用的策略。交叉验证可以帮助我们更准确地评估模型的性能,并避免过拟合或欠拟合的问题。通过交叉验证,我们可以得到更稳定的特征重要性评估结果。 总之,XGBoost提供了一种有效的方法来计算和使用特征的重要性。通过分析特征的重要性,我们可以更好地理解模型的预测能力,并进行特征选择以提高模型的性能。 #### 引用[.reference_title] - *1* [Python中XGBoost的特性重要性和特性选择](https://blog.csdn.net/liuzonghao88/article/details/88857468)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [【算法】关于xgboost特征重要性的评估](https://blog.csdn.net/sunyaowu315/article/details/90664331)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [[机器学习] 树模型(xgboost,lightgbm)特征重要性原理总结](https://blog.csdn.net/zwqjoy/article/details/97259891)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值