树模型和神经网络比较

模型的选择上来看:

1、如果不强调绝对的解释度,尽量避免单课决策树,用集成树模型
2、在集成树模型上,优先用xgboost;
3、在中小数据集上,优先选择集成树模型大数据集上用神经网络
4、在需要模型解释度的项目上,优选使用树模型
5、在项目时间较短的项目上,如果数据质量低(大量缺失值、噪音等),优先使用集成树模型
6、在硬件条件有限以及机器学习知识有限的前提下,优选选择树模型
7、对于结构化较高的数据,尤其是语音、图片、语言等,优先使用神经网络模型

一般来说,在小数据集多特征下,集成的树模型往往由于神经网络。随着数据量增大,两者接近,随着数据量继续上升,神经网络的优势会逐步体现。

模型的本质来看:

1、数据量:神经网络一般需要大数据量,而小数据量上树模型有优势。
2、特征工程:神经网络需要更苛刻的数据准备工作。树模型不用(缺失值处理,数据类型转换,数据缩放归一化、初始化学习率参数等的调整)。
3、调参难度:集成树模型需要(i)基学习器数量(ii)考虑特征数(iii)最大深度等等。而神经网络调参则复杂许多。
4、模型的可解释性:神经网络的可解释性比较差。而一般xgboost都有特征重要性的排序等等。
5、模型的预测能力:大中型数据上模型表现相似,随着数据量增加,神经网络的潜力也越大。
6、项目周期:神经网络一般需要更多的时间,同时还需要硬件支持。

一般来说,小数据量多特征的时候,集成树模型优于神经网络;随着数据量增大,两者表现相似;随着数据量增加,神经网络的优势会逐渐体现出来。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值