机器学习-面试必备-问题列表



1.struct和class区别,你更倾向用哪个
2.kNN,朴素贝叶斯,SVM的优缺点,朴素贝叶斯的核心思想,有没有考虑属性之间不是相互独立的情况
3.10亿个整数,1G内存,O(n)算法,统计只出现一次的数。
4.SVM非线性分类,核函数的作用
5.海量数据排序
6.项目中的数据是否会归一化处理,哪个机器学习算法不需要归一化处理
7.两个数组,求差集
8.开放性问题:每个实体有不同属性,现在有很多实体的各种属性数据,如何判断两个实体是否是同一种东西
9.写程序实现二分查找算法,给出递归和非递归实现,并分析算法的时间复杂度。
10.用C/C++实现单链表的反转。
11.python读取文件,写代码
12.python计算一个文件中有N行,每行一列的数的平均值,方差,写代码
13.C++求两个一维数组的余弦相似度,写代码
14.SVM详细过程,支持向量,几何间隔概念,拉格朗日函数如何求取超平面,非线性分类
15.海量数据中求取出现次数最大的100个数。
16.字符串翻转,手写
17.快排,手写
18.KNN(分类与回归)、CART(回归树用平方误差最小化准则,分类树用基尼指数最小化准则)、Logistics(推导)、GBDT(利用损失函数的负梯度在当前模型的值作为回归问题提升树算法中的残差的近似值,拟合一个回归树)、随机森林(Bagging+CART)
19. 非递归的二叉前序遍历 && 两个字符串的复制(除了字符串地址重叠的情况,也要注意判断字符串本身的空间足够不足够,对于异常情况要考虑全面)
20.一个概率题目: 6个LED灯管,找整体旋转180'后仍然是一个正常输入的情况(考虑全即可)
21. 给一个情境,考察你对于机器学习算法的了解程度以及常用情境的了解(要特别注意思维要开阔,我就是陷入某一个)
22.一个数组,如果存在两个数之和等于第三个数,找出满足这一条件的最大的第三个数(设为x+y =c)
23.聚类和分类有什么区别?分类是事先知道类标的,而聚类事先不知道类标。
24.快速排序,怎样将二叉排序树变成双向链表,且效率最高,从栈里找最小的元素,且时间复杂度为常数级,
25.神经网络,plsi的推导,还有float转string,判断一棵树是否是另一棵的子树。
26.写写SVM的优化形式、推导SVM
27.在一个n*n的矩阵中填数的问题,那种转圈填数,上网搜搜有
28.链表存在环问题,环的第一个节点在哪里?
29.几个排序算法,必须写出
30.用拉格朗日公式推导SVM kernel变换
31.数据结构当中的树,都有哪些?
32.推荐系统
33.输出一个循环矩阵,这个我想的有点复杂了,简单的循环即可实现,我用了递归
34.翻转字符串,《剑指offer》原题
35.确定链表中环的起始位置
36.N个数找K大数那个题,堆解释了一遍,比较满意,问还能怎么优化O(Nlogk)的方法,并行方面想
37.一个班60个人怎么保证有两个人生日相同,听完后有点奇怪,①为什么是60个人?②为什么是保证?,反正没管这么多就是概率嘛,算就完了.
38.问一个字符串怎么判断是邮箱比如:vzcxn@sdf.gre.有限状态自动机,然后要我画状态转移图.
39.快排的空间复杂度,答O(n).归并的空间复杂度,答O(n).他让我好好想想,我想了会,难道空间复杂度的常数不能省吗?然后做了修改,快排是O(n)归并是O(2n).
40.给10^10个64位数,100M内存的空间排序,感谢队长刚好在去的前一天教过我一个求中位数的方法.用文件操作来做了,像快排一样,二分选个数统计大于那个数的数量和小于那个数的数量,如果能用100M的空间排序就把那些数排了,如果不能继续.直到能排为止.
41.main(argc,argv[])里面两个参数什么意思
42.kmp算法
43.电梯问题
44.一个应用题,考察hash算法
45.求最大字段和,用动态规划和分治法两个方法,时间复杂度怎么算
46.写了一下二分查找算法的代码
47.统计字符串中出现的字符个数,忽略大小写,其中可能有其他字符。
48.一个文件2G内容是userid,username 一个文件3G内容是username,userpassword 要求:输出userid,userpassword 8核cpu 2G内存
49.贝叶斯概率、卷积
50.寻找二叉树的公共父节点
51.通过寻找两条路径,然后寻找最后一个公共节点。
52.SVM核函数,合并两个文件的问题
53.b+ b-树、红黑树、要求写出排序算法
54.判断两条链表是否交叉。
55.归并排序,random指针的链表复制等
56.树的广度、深度遍历,
57.L1和L2的区别
58.生成与判别模型
59.隐式马尔科夫
60.SVM:中文分词
61.关联分析、aprior
62.各类算法优缺点、模型调优细节
63.特征提取的方法(无关键词也是一个特征)
64.稳定与不稳定排序
65.RBF核与高斯核的区别
66.Python实现LogReg
67.ROC与AUC
68.K-means起始点
69.深度学习和机器学习的区别、数据挖掘和人工智能的区别、测试集和训练集的区别kmeans,FCM,SVM算法的具体流程、如何优化kmeans算法
70.二叉树前序遍历非递归实现,大家总结一下前序,中序,后序遍历的非递归实现,尝试多几种方法会有不一样的收获。
71. Deep CNN, Deep RNN, RBM的典型应用与局限,看Hinton讲义和Paper去吧
72. 有哪些聚类方法?
73. 判断一个链表是否存在环?回 答:通过两个指针,快慢指针进行遍历。
74. 正则化是怎么回事(L1和L2)
75.PCA
76. 学校食堂如何应用数据挖掘的知识
77. 哪些模型容易过拟合,模型怎么选择
78. 什么是模糊聚类,还有划分聚类,层次聚类等
79. 最长上升子序列啊,两个大小相同的有序数组找公共中位数
80. 并行计算、压缩算法
81.SVD、LDA
82. naive bayes和logistic regression的区别
83.LDA的原理和推导
84.做广告点击率预测,用哪些数据什么算法
85.推荐系统的算法中最近邻和矩阵分解各自适用场景
86.用户流失率预测怎么做(游戏公司的数据挖掘都喜欢问这个)
87.一个游戏的设计过程中该收集什么数据
88.如何从登陆日志中挖掘尽可能多的信息
89. 统计学习的核心步骤:模型、策略、算法,你应当对logistic、SVM、决策树、KNN及各种聚类方法有深刻的理解。能够随手写出这些算法的核心递归步的伪代码以及他们优化的函数表达式和对偶问题形式。
90. 梯度下降、牛顿法、各种随机搜索算法(基因、蚁群等等)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值