自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(16)
  • 收藏
  • 关注

转载 队列和栈

1、用数组实现大小固定的队列和栈 2、实现特殊的栈,包含栈的基本功能,同时实现返回栈中最小元素操作 3、队列和栈的相互实现 4、转圈打印矩阵 5、旋转方形矩阵 6、之字形打印矩阵 7、行列都排序的矩阵中找数 转载于:https://www.cnblogs.com/Luckidmi/p/11489645.html...

2019-09-09 08:35:00 98

转载 NLP模型之NNLM

1、背景 语言模型就是计算句子中的词按照组成句子的顺序排列的概率,由此来判断是不是正常句子。 传统的语言模型,N-gram模型,基于马尔科夫假设,下一个词的出现仅依赖前面的一个或n个词 对一句话S=x1,x2,x3,x4,x5,…,xnS=x1,x2,x3,x4,x5,…,xn而言,它的概率: P(S)=P(x1,x2,x3,x4,x5,…,xn) =P(x1)P...

2019-07-18 17:35:00 278

转载 回归问题

1、最大似然估计解释最小二乘 2、求解参数 为啥加入扰动可以保证参数可解 3、正则化 L1 L2 (加入正则项的目的是为了防止过拟合) 当参数过拟合数据时,得到的参数分布不均衡,可能存在前边的参数很大,后边的参数很小的情况,所以在目标函数中加入参数的平方和乘以一个系数,来保证参数均衡,不至于有太大参数出现。 Ridge回归,加入L2正则项 LASSO回归,加入L1正则项,...

2019-02-27 18:07:00 115

转载 排序

基本排序:插入,选择,冒泡 三大排序:归并,快速,堆排 1、归并排序 --时间复杂度O(N*logN),空间复杂度O(N) 思路:递归方法,本质是压栈出栈的过程,关键点是找出递归的basecase,即问题划分到不能再往下划分的点,再将排好序的两部分合并即可 非递归方法,每相邻2个数排序,再下一层排序,k值每次*2,即可 public class...

2019-02-27 18:07:00 77

转载 图的遍历(深度优先DFS和广度优先BFS)

理论基础: 1、小米笔试 https://github.com/imhuay/Algorithm_Interview_Notes-Chinese/blob/master/D-%E7%AC%94%E8%AF%95%E9%9D%A2%E7%BB%8F/%E7%AC%94%E8%AF%95-%E5%B0%8F%E7%B1%B3-180920.md 2、头条 https://g...

2019-02-27 18:07:00 113

转载 leetcode-56

1、给出不同区间的列表,若有重叠区域则组合后输出 2、同类型的题目--今日头条(文章病句标识) 转载于:https://www.cnblogs.com/Luckidmi/p/10421916.html...

2019-02-27 18:06:00 85

转载 决策树

理论: Bagging思想:从总样本中每次抽取一定样本,去构建学习器,然后把学习器做投票或者平均,构成集成学习器 随机森林是Bagging思想的直接应用,取一部分的样本,取一部分的属性,采样过程是有放回的 问题: 1、信息增益跟基尼系数在数学上几乎相等,但ID3取信息增益下降最多的,CART选基尼系数最小的,且为什么CART构建的是二叉树 2、决策树如何处理连续值的分类 3、...

2019-02-27 18:06:00 55

转载 动态规划

1、关键找出递推公式 转载于:https://www.cnblogs.com/Luckidmi/p/10421896.html

2019-02-27 18:06:00 51

转载 熵与EM算法

1、熵是信息量的期望 公式: 2、联合熵:VENN图 条件熵: 3、正负样本不均衡处理: 4、数据与特征处理 转载于:https://www.cnblogs.com/Luckidmi/p/10435142.html...

2019-02-27 18:06:00 108

转载 特征工程处理

1、不均衡样本的处理方法即评价指标 当样本中正负样本相差悬殊时,单纯使用某一分类器分类或者准使用确率作为评价指标将使得模型在预测时不再work 因此会做一些处理,包括: 正样本>>负样本,且样本数量较大,则采用下采样或者欠采样,对小样本过采样,对大样本欠采样 正样本<<负样本,且样本数量不大,则可以 (1)尝试采集更多的数据 (2)过采样(比如图像里的...

2019-02-27 18:05:00 92

转载 SVM

1、函数间隔与几何间隔 函数间隔是垂直坐标系的距离,几何间隔是垂直分类面的距离 2、最优间隔分类器 3、拉格朗日求解 4、最优间隔分类器求解 5、SMO算法 6、核方法 7、软间隔分类器 8、合页损失函数 9、多分类 转载于:https://www.cnblogs.com/Luckidmi/p/10445213.html...

2019-02-27 18:05:00 134

转载 链表

1、链表相加 题目: 给定两个链表,分别表示两个非负整数,逆序存储在链表中,计算两个数的和,并返回链表头指针,如:输入:2->4->3、5->6->4,输出7->0->8 思路及代码: public ListNode addTwoNumbers(ListNode l1, ListNode l2){ // 堆栈思路,首先将list都放入stack中,再进行操作 ...

2019-02-27 18:04:00 90

转载 贝叶斯网络

1、概率图模型 2、原理 引例: (1)本福特定律,生活数字中,首位数字1出现的概率约为总数的三成,并且数字越大,出现的概率越小。 (2) 3、 转载于:https://www.cnblogs.com/Luckidmi/p/10410411.html...

2019-02-21 09:20:00 81

转载 RCNN--Fast RCNN--Fastrer RCNN

传统目标检测的方法: 将CNN引入目标检测领域之前,经典的目标检测算法使用滑动窗口依次判断所有可能的区域,并在区域中提取人工标定的特征。 引入CNN之后,RCNN采用Selective Search预先提取候选区域,并采用深度网络提取特征。 RCNN pic1 基本流程: 1、 每张图片生成2k个候选区域 2、对每个候选区域使用卷积神经网络提取特征(4096...

2019-02-20 11:25:00 81

转载 剑指offer-22

题目:从上往下打印出二叉树的每个节点,同层节点从左至右打印 思路:利用队列先进先出的特点来缓存节点数据,从根节点开始,如果存在左右孩子,则把左右孩子放到队列中,同时删除队列头部数据,把数据存入list中。直到队列为空停止。 代码(Java): import java.util.ArrayList; import java.util.Queue; import java.ut...

2019-02-19 15:45:00 78

转载 leetcode-2

Add Two Numbers Input: (2 -> 4 -> 3) + (5 -> 6 -> 4) Output: 7 -> 0 -> 8 Explanation: 342 + 465 = 807. public ListNode addTwoNumbers(ListNode l1, ListNode l2) { Lis...

2019-01-10 16:39:00 86

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除