数据模型工程师笔试题目
2、雪花模型与星型模型的差别?(选做)
3、有如下表:TABLE_USER,表的内容包含:MEMBER_ID、ID_CARD、ID_CARD_NAME。
(1)取ID_CARD,ID_CARD_NAME重复值。(2)取top5与后top5。
4、按要求写SQL:表A如下,
USER_ID(ID,字符类型)
LOGIN_TIME(字符时间类型,只包含一天的数据)
ITEM(访问页面地址,字符型)
要求:取出每个用户访问的第一个ITEM(按时间最早)形成新表B,表B的结构和A一样。
10道选择题目
10、维归约常用的处理技术有()
A、主成分分析
B、特征提取、
C、奇异值分解
D、特征加权
E、离散化
1、异常值是什么,列举至少3中识别连续变量异常值方法?
2、准确率,召回率,F1值计算公式,他们和ROC曲线的关系?
3、过拟合和欠拟合产生的原因,如何解决?
4、一道python使用numpy的程序优化题目,题目给出一段代码,提示为向量化计算
。
5、为何不用逻辑回归算法,为什么选择GBM算法?
6、什么样的数据集不适合深度学习?
7、试着设计一个3层神经网络,写出前向传播过程,什么造成梯度消失问题,试着推导一下?