面试
Rnan-prince
知是行之始,行是知之成(1352638748@qq.com)
展开
-
机器学习算法岗常见笔试面试题整理
数据库中的主键、索引和外键(数据分析岗经常问) 决策树ID3和C4.5的差别?各自优点? Boost算法 CART(回归树用平方误差最小化准则,分类树用基尼指数最小化准则) GBDT与随机森林算法的原理以及区别。 优化算法中常遇到的KKT条件?作用是? 最近邻算法KNN(分类与回归) L1和L2函数?L1和L2正则项的比较,如何解决 L1 求导困难? L1正则为何可把系数压缩成0,...转载 2018-08-13 08:52:28 · 628 阅读 · 0 评论 -
数据挖掘和机器学习20个面试问题
1.什么是数据标准化,为什么要进行数据标准化?1.1定义1.2为什么要做数据归一化?数据归一化后,损失函数变量前面的系数差距已不大,图像的等高面近似圆形,在梯度下降进行求解时能较快的收敛。 一些机器学习算法需要计算样本之间的距离(如欧氏距离),例如 KNN、K-means 等。如果一个特征值域范围非常大,那么距离计算就主要取决于这个特征1.3为什么要进行数据标准化?数据标准...原创 2018-08-26 22:46:28 · 2006 阅读 · 1 评论 -
判断一个自然数是否是某个数的平方,不能使用开方运算
方法1: 遍历从1到N的数字,求取平方并和N进行比较。 如果平方小于N,则继续遍历;如果等于N,则成功退出;如果大于N,则失败退出。 复杂度为O(n^0.5)。// 方法1:遍历从1到N的数字,求取平方并和N进行比较。复杂度为O(n^0.5)。 public static boolean isSquare1(int num) { if (num == 0 || num ==...原创 2018-08-22 21:37:44 · 2590 阅读 · 0 评论 -
hadoop基础总结
什么是 Hadoop? Hadoop 是一个开源软件框架,用于存储大量数据,并发处理/查询在具有多个商用硬件(即低成本硬件)节点的集群上的那些数据。总之,Hadoop = 分布式存储+分布式计算 。Hadoop的四大特性(优点)扩容能力(Scalable):Hadoop是在可用的计算机集群间分配数据并完成计算任务的,这些集群可用方便的扩展到数以千计个节点中。 成本低(Economi...原创 2018-09-04 10:50:11 · 456 阅读 · 0 评论 -
翻转句子Reverse Words in String
问题:将字符串中的单词们首位调换位置。Reverse words in string. Given an input string s, reverse the string word by word.For example, given s = “the sky is blue”, return “blue is sky the”.方法一:public static Strin...原创 2018-08-27 19:18:38 · 293 阅读 · 0 评论 -
数独相关题目汇总-Sudoku
Valid Sudoku数独定义:1.每一行有九个1-9不同数字2.每一列也有九个1-9不同数字3.每九个方格也有九个1-9不同数字1.判断数独是否有效-描述Determine if a Sudoku is valid, according to: Sudoku Puzzles - The RulesThe Sudoku board could be par...原创 2018-08-22 09:06:02 · 5791 阅读 · 0 评论 -
打印和为sum的组合,动规法+DFS+迭代法
一.判断是否有和为sum的组合,动规法,O(n^2)// 判断是否有和为n的组合,动规法,O(n^2)public static boolean findSum(int[] a, int n) { boolean[] dp = new boolean[n + 1]; for (int i = 0; i < a.length; i++) { if (a[i] >...原创 2018-08-17 12:46:11 · 803 阅读 · 1 评论 -
推荐算法种类总结
(一)协同过滤(CF)大致可分为:基于邻域的推荐、基于模型的推荐1.基于邻域的协同过滤有:基于用户的协同过滤:与用户A相似的用户B,推荐用户A喜欢的物品给B 基于物品的协同过滤:推荐与用户A历史上喜欢的物品相近的物品2.基于模型的推荐:使用部分机器学习算法,找出用户与项的相互作用模型,从而找出数据中的特定模式。其中之前研究的NMF模型就是其中的一种,NMF属于基于模型的协同过滤算法...原创 2018-08-11 22:03:19 · 7837 阅读 · 0 评论 -
mysql面试题总结
1. 主键 超键 候选键 外键1)超键(super key) :在关系中能唯一标识元组的属性集称为关系模式的超键2)候选键(candidate key):不含有多余属性的超键称为候选键3)主键(primary key):用户选作元组标识的一个候选键程序主键4)外键(foreign key):如果关系模式R1中的某属性集不是R1的主键,而是另一个关系R2的主键则该属性集是关系模式R1...转载 2018-09-05 09:11:07 · 996 阅读 · 0 评论