基础知识1

1、1x1卷积核作用

实现跨通道的信息交互与整合

改变卷积层通道数,控制模型的复杂程度

如果将通道维度看作特征维度,起到了全连接层的作用,使得输入输出具有相同的高和宽度

2、线性回归和逻辑回归联系和区别

可以将逻辑回归看作是在线性回归的基础上加上sigmoid函数,用于分类任务

线性回归可以用来预测连续变量,逻辑回归可以用来预测离散变量

线性回归可以看作是拟合函数,逻辑回归可以看作是预测函数

线性回归通过最小二乘法计算参数,逻辑回归用似然估计计算参数

3、逻辑回归的评价指标是什么(ROC/AUC让你解释什么是AUC除ROC曲线围成的面积之外的那个定义

可以用准确率、召回率来评价,ROC给出了当前阈值变化时真阳率和假阳率变化情况,AUC是ROC曲线下的面积,衡量了分类器的性能,值为1时最好。
AUC怎么计算:若随机抽取一个阳性样本和一个阴性样本,分类器正确判断阳性样本的值高于阴性样本的概率 = AUC

4、机器学习和深度学习中的损失函数

5、XGBOOST + LIGHTGBM

1、XGBoost和LightGBM如何处理数据的

2、随机森林和GBDT的区别

3、XGBoost的原理。XGBoost和LightGBM的区别

4、XGBOOST的原理,公式,boosting算法优势劣势,决策树分类方式

5、XGBOOST和随机森林和逻辑回归各自的优缺点

6、介绍XGBOOST的feature importance原理

7、LightGBM如何调参,调参num_tree与max_depth的先后顺序有什么影响

8、boosting和bagging区别

GBDT的原理 (理论基础)

决策树节点分裂时如何选择特征,写出Gini index和Information Gain的公式并举例说明(理论基础)

分类树和回归树的区别是什么?(理论基础)

与Random Forest作比较,并以此介绍什么是模型的Bias和Variance(理论基础)

XGBoost的参数调优有哪些经验(工程能力)

XGBoost的正则化是如何实现的(工程能力)XGBoost的并行化部分是如何实现的(工程能力)

为什么预测股票涨跌一般都会出现严重的过拟合现象(业务理解)

如果选用一种其他的模型替代XGBoost,你会选用什么?(业务理解和知识面)

bagging:在原始数据集上有放回的选择和原始数据集相同大小的数据,用这些数据训练多个不同的分类器。

boosting:boosting集中关注被已有分类器错分的那些数据来获取新的分类器,bagging中分类器权重相同,boosting分类器权重不同。

6、随机森林

1、随机森林和因果森林区别

随机森林采用决策树,因果森林采用因果树。因果树用一半的样本用于树的生成,确定分割特征空间的准则,另一半的样本用于树的叶子结果预测,估计子空间的因果效应,用于控制树的复杂度。

2、集成方式

参与训练的基础学习器并行生成,通过对每个基学习器的预测进行投票来表决。

3、随机森林和决策树得区别

随机森林是由多个决策树组成的,随机森林在构建树时随机选择训练数据;同时在分割时选择随机的特征子集。

4、SVM和随机森林的联系和区别

7、决策树

8、LSTM + GRU + CNN等基础网络

9、怎么做feature筛选,介绍IV\WOE方法

过滤法:将特征变量与目标变量进行度量评分,具体度量有皮尔森相关系数、互信息和最大信息系数、距离相关系数;

嵌入法:使用机器学习算法训练,得到各个特征的系数;

包装法:每次增加或者删除若干特征,建立算法模型,从而根据评价函数进行选择。

变量的WOE、IV越大,越应该将其加入到模型的变量中。可以衡量变量的预测能力。

WOE表示分组后这个组的预测为1的数量与预测为0的数量比值和所有样本这个值的比值。

IV是WOE乘上(这个组中1的数量/所有样本1的数量-这个组中0的数量/所有样本0的数量)IV体现了每个组中个体数量占整体数量的比例。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值