自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 后台及测试开发面试基础知识

队列和栈的应用场景:网络浏览器多会将用户最近访问过的网址组织为一个栈。这样,用户每访问一个新页面,其地址就会被存放至栈顶;而用户每按下一次“后退”按钮,即可沿相反的次序访问此前刚访问过的页面。当我们使用邮箱群发邮件时,只需等待很短的时间,浏览器提示提交成功,正在发送之类的信息时,用户就可以关掉浏览器,稍后,收件地址栏里的邮箱将陆续收到该群发邮件,再比如群发定时邮件,以及当商城系统中有客户下单,客户,客服,仓库等相关人员收到订单邮件信息。软件的需求定义与分析、设计、实现、测试、交付和维护堆和栈区别:

2021-11-24 11:23:07 984

原创 决策树面试主要知识点

决策树如何分裂?信息增益公式ID3:信息增益率公式c4.5:基尼系数:决策树过拟合?控制模型复杂度1.控制树的深度2.把不重要的特征进行剪枝操作3.正则化方法集成算法是将多个弱分类器集成起来的强分类器弱分类器可以理解为欠拟合的分类器,弱指的是对于全部数据的泛化能力弱,而对于某些数据比较准确。bagging特点:1.基于数据随机重抽样的分类器构建2.可以并行3.弱分类器之间几乎相互无关典型 RFbooosting特点:1.只能串行2.弱分类器之间强相关3.结果是所

2021-08-23 15:11:02 144

原创 SVM面试重点

最大化边界:针对少数离群点:非线性核方法是由于低维空间找不到一个很好的分割平面,所有映射到高维空间解决问题:

2021-08-23 11:06:03 112

原创 模型微调的理解

微调(fine tuning)。微调由以下4步构成。1.在源数据集(如ImageNet数据集)上预训练一个神经网络模型,即源模型。2.创建一个新的神经网络模型,即目标模型。它复制了源模型上除了输出层外的所有模型设计及其参数。我们假设这些模型参数包含了源数据集上学习到的知识,且这些知识同样适用于目标数据集。我们还假设源模型的输出层跟源数据集的标签紧密相关,因此在目标模型中不予采用。3.为目标模型添加一个输出大小为目标数据集类别个数的输出层,并随机初始化该层的模型参数。4.在目标数据集(如Fashion

2021-08-19 17:04:14 1636 1

转载 神经网络中的Dropout与机器学习的哪种方法类似

链接:https://www.nowcoder.com/questionTerminal/44f4989615da451e9e12641a28aa51ef来源:牛客网类似于机器学习中常见的Bagging取平均的作用:先回到标准的模型即没有dropout,我们用相同的训练数据去训练5个不同的神经网络,一般会得到5个不同的结果,此时我们可以采用 “5个结果取均值”或者“多数取胜的投票策略”去决定最终结果。例如3个网络判断结果为数字9,那么很有可能真正的结果就是数字9,其它两个网络给出了错误结果。这种“综合

2021-08-11 17:08:48 1271

原创 如何解决过拟合与欠拟合?

过拟合:过拟合概念过拟合是指学习的模型包含的参数太对,以至于出现对已知数据预测的很好,但对未知数据预测的很差的现象;模型过拟合等价于模型泛化能力差。1.加入正则项L1正则化是指权值向量中各个元素的绝对值之和,L1正则化可以产生稀疏权值矩阵,即产生一个稀疏模型,可以用于特征选择,一定程度上,L1也可以反之过拟合L2化是指权值向量中各个元素的平方和的平方,L2正则化可以防止模型过拟合。参考:https://blog.csdn.net/weixin_42111770/article/details/8

2021-08-10 20:49:10 473

原创 FM 和 LR 最大的差异是什么

LR:优点:是一个很好的baseline,效果不错,当然因为效果不错,所以后续的版本想超过它,真的还是很难的。实现简单,有开源的工具可以直接用来训练,在线的代码也写起来也比较容易缺点:因为是线性模型,所以有选择交叉特征的工作,这部分工作消耗大量的精力,但往往没什么效果。一般都是wrapper方法选择,每轮可能都要进行小时级的运算,理论上要进行2^n轮(n是特征数),但因为离线分析的指标和线上效果不一定是强相关的,所以分析起来更痛苦。更令人崩溃的是点击率预估的数据变化是比较大的,离线选出来的特征,

2021-08-10 10:54:24 1298

原创 一道hard难度的算法 猿辅导笔试 数箱子

题目大概是这样:[]代表一个箱子,[]3代表3个箱子,[[]3]代表一个大箱子里有3个小箱子,一共四个箱子,[[]3]2代表两个大箱子,每个大箱子里有3个小箱子一个8个箱子。问题是一共有多少个箱子?输入:一行字符串,代表箱子摆放情况。箱子一定是完整的[]输出:int整数示例:输入:[][[][][]2]3 输出:16输入:[][][[[]3[]2]2]2 输出:28def longest(s: str): if not s:#输入为空 return 0 st

2021-08-03 17:05:03 518

原创 NLP学习(1)读论文

自然语言处理领域顶会:ACL、EMMP、NAACL等机器学习/深度学习领域:ICML、NIPS、UAI数据挖掘领域:KDD、WSDM人工智能领域:ISCAI、AAAI

2021-07-11 22:39:47 116 1

原创 长度为n的数组,求连续k个最大值,输出开始的下标

阿里面试题有n盒糖果,每盒糖果数量为a[i]。这n盒糖果从1到n的顺序顺时针方向摆成圆圈,索引为n的糖果顺时针方向下一个糖果盒索引为1,你可以选择任意一盒糖果,然后从它开始顺时针拿走连续k盒糖果,问从哪盒糖果开始拿可以拿最多的糖果,输出索引。输入描述:第一行 两个整数 n,k(1<=k<=nM=100000)第二行 n个整数a[i]输出一行一个整数,索引##长度为n的数组,求连续k个最大值,输出开始的下标。// An highlighted block`import sys

2021-04-19 20:54:22 700 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除