阿里巴巴2018届校招秋招简历评估面经

1、GBDT和随机森林的主要区别

2、单颗树的构建过程(说了ID3,C4.5)

3、竞赛相关流程
基于树模型有必要做标准化吗(树模型没必要,SVM/神经网络有必要)
这么多维度是怎么构建出来的
把两个特征做除法得到了新特征,在GBDT有没有这个必要
(有,虽然gbdt可以做到两列特征的关联,但是比例特征和关联特征是有区别的,因为你没办法确定他是不是准确关联了你目标的两列特征。
比如我先基于 a列做分叉,再基于b列做分叉,有个很弱的比例特征的表征。在a的基础上比如 a < 500,然后再在b的基础上比如 b < 100,那么这两个同时满足的话 是可以学到一定的比例关系。但是如果对应的 a = 5000 b = 1000,就没办法学习到了。
同时,可能会在 a点的右分支的左分支表征一样的信息,相当于把模型复杂化了。但是如果我们输入比例特征的话,第一个分裂节点可能就不是a,而是 b/a了,输入比例特征 是有利于模型进行学习的)

4、肿瘤项目相关(文本形式,图像形式)
图像用了什么算法(CNN/AlexNet)
文本有没有用到CNN,样本大概有多少例
在CNN(深度学习)上融合文本的feature有没有可能性
算法模型在后面想怎么完善去提高准确率(模型融合)

5、CNN的网络结构(输入层、卷积层、激励层、池化层、全连接层)
ReLU的形式,数学公式是什么,和Sigmoid的图像有什么区别
全连接层的基本结构是什么&#x

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值