一、数字类的找规律(10道,时间10分钟)
1、1 2 6 24 ()
2、1 2 2 4 3 8 4 ()
3、1 2 3 7 22 ()
4、1.01 2.02 3.04 5.08 8.16 ()
5、79 64 20 35 () 42
6、13.4 25.7 23.5 44.8 ()
7、1 1 4 9 25 64 ()
8、1 3 5 10 18 32 ()
9、71 70 65 51 ()
10、2 2 3 6 5 15 7 () 9 45
二、图形找规律(10道,时间10分钟)
这个比较难记录,这个也是考察自己快速观察规律能力
三、生活中蕴含的题目
1、一个蚂蚁从地球仪北极定点出发,向南走了xcm,再向东走了ycm,问蚂蚁的位置
2、一个积木,在外边面图上颜色,问没有颜色的积木的方块的个数
3、小陈有5个面包,小白有3个面包,小黄没有带面包,然后他们三个平分吃了所有的面包,小黄掏出8元钱给小陈和小白分,问,小陈和小白各分多少钱。
。。。
四、大题
1、GBM/GBDT模型的概念
2、Random Forese模型的概念
3、忘记了
4、Recall precision评估模型重要指标
5、L1和L2范数是常用正则化的方法
6、避免样本不再重复方法。
7、boosting和bagging算法概念
8、忘了
9、模型优化
10、忘了
11、已知数据集D={xi,yi},i=1,2,3,4,,,,n,其中xi属于R上的实数,yi属于R上的对应目标值
(1)假设使用logistic regression进行函数拟合,写出合理的决策函数公式
(2)请写出logistic regression最大似然函数
(3)使用随机梯度下降对(2)中的损失函数进行优化,给出1中未知参数梯度,推导并写出算法
12、underfitting和overfitting定义?判断方法?如何避免(2种以上解决方法,举例说明)
13、向量a=(x1,x2,,,,xn),b=(y1,y2,,,,,,yn)
求:(1)a和b之间欧式距离
(2)a和b之间余弦距离
(3)其他相关的距离