自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 BM25算法

BM25算法 - 简书BM25算法, Best Matching - 知乎BM25是目前信息索引领域最主流的计算query与文档相似度得分的算法。BM 是Best Match最佳匹配的缩写,25指的是第25次算法迭代。BM25的一般公式:其中Q 表示query,表示query中的分词,d表示文档。表示切词权重,R代表切词和文档的相关性。具体来说,它是一种基于概率检索模型提出的算法,BM25的计算主要有几个部分组成:query中每个分词的重要性 query中每个分词和文档之间..

2022-05-04 19:17:15 8260

原创 用户画像中偏好排序方法

背景:电商中经常需要计算或预测商品的转化率。点击率r=C/I,考虑两种情况:1、对于冷启的商品,点击和曝光量都是0,此时,这个商品的CTR应是多少?2、极端情况下,商品的曝光量是1,点击量是1,此时明显CTR过大。如何改善计算方法使得计算结果相对准确呢?下面两种方法:威尔逊区间更偏向于统计学习方法,而贝叶斯平滑偏向于机器学习方法,都一定程度上缓解了小样本数据带来的计算准确度不高的情...

2018-09-30 18:27:54 8659

转载 逻辑回归

什么是逻辑回归?Logistic回归与多重线性回归实际上有很多相同之处,最大的区别就在于它们的因变量不同,其他的基本都差不多。正是因为如此,这两种回归可以归于同一个家族,即广义线性模型(generalizedlinear model)。这一家族中的模型形式基本上都差不多,不同的就是因变量不同。如果是连续的,就是多重线性回归;如果是二项分布,就是Logistic回归;

2017-11-23 11:02:04 322

原创 操作系统面试持续总结中。。。

1、进程和线程的区别? 进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位。线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。

2017-10-31 16:45:39 261

原创 C++面向对象程序设计持续总结中。。。

面向对象程序设计  核心思想:封装、继承、多态继承: 在根部有一个基类,其他类则直接或间接地从基类继承而来,这些继承得到的类称为派生类。基类负责定义在层次关系中所有类共同拥有的成员,而每个派生类定义各自特有的成员。对于某些函数,基类希望它的派生类各自定义适合自身的版本,此时基类就将这些函数声明成虚函数:加关键词virtual ,派生类必须通过使用类派生列表明确指出它是从哪个基类继承而来

2017-10-19 21:20:37 1180

原创 面试常见C++问题总结

一、new 和malloc 的区别   答:int *p;                                             p=new int;          p=(int *)malloc(sizeof(int)*128);1、new 是C++中的关键字,malloc是C语言中的函数;2、new返回指定类型的指针,且可以自动计算所需大小;而mall

2017-10-16 20:27:37 234

原创 LATEX 写作经验总结

很多学术文章要求用latex排版,但是对于没用过latex的小白来说,实在是太麻烦了,各种问题层出不穷。刚用 latex 完成一篇论文,方法肯定不是唯一的,而且我用到的方法也许不是最简洁的,但是还是成功的完成了。我把一些经验分享一下,希望能帮到大家。    1、一般用windows操作系统的人会选择CTEX中的WinEdt 团建作为编写LaTex文档的工具,因为它里面会将latex命令改变颜色

2017-05-25 19:47:24 4811

转载 深度学习之卷积神经网络

卷积网络介绍转自http://www.cnblogs.com/alexcai/p/5506806.html卷积神经网络是一种多层神经网络,擅长处理图像特别是大图像的相关机器学习问题。卷积网络通过一系列方法,成功将数据量庞大的图像识别问题不断降维,最终使其能够被训练。CNN最早由Yann LeCun提出并应用在手写字体识别上(MINST)。LeCun提出的网络称为LeNet,其网

2016-08-30 16:18:06 5014

转载 Matlab 图像处理 形态学 腐蚀 膨胀 开闭运算 连通分量

【转载】:http://www.cnblogs.com/tornadomeet/archive/2012/03/20/2408086.htmlMatlab 形态学图像处理      形态学是提取图像特征的有力工具,针对二值图像和灰度图像的腐蚀、膨胀和重构的基本操作可以组合使用,以执行非常宽泛的任务。其练习代码和结果如下:  1 %% 第9章 形态学处理 2

2016-05-26 16:35:26 1858

转载 机器学习开源代码大集合

一、特征提取Feature Extraction:SIFT [1] [Demo program][SIFT Library] [VLFeat]PCA-SIFT [2] [Project]Affine-SIFT [3] [Project]SURF [4] [OpenSURF] [Matlab Wrapper]Affine Covariant Features [5] [O

2016-05-13 16:58:17 1330

原创 matlab实现图像增强

下面是根据我自己的工作整理的空间域和频率域的图像增强,首先将彩色图像转化为灰度图像,matlab 代码如下:clear all I1=imread('1.jpg'); imshow(I1) title('输入的彩色JPG图像') I = rgb2gray(I); %灰度化后的数据

2016-04-11 10:42:33 19685 3

原创 浅谈EM算法

最近学习Grabcut,看了EM算法的博客,将我的理解整理了一下:      首先看一下参数估计中点估计的一种方法:最大似然估计。设总体X的分布函数的形式已知,但它的一个或多个参数未知,借助于总体X的样本来估计未知参数的值,该问题就是参数的点估计问题。我们收集到的样本都是独立同分布的,分布律P{X=x}=p(x|θ),我们按照一定的概率得到了一批样本,样本x1,x2....xn的联合分布律

2016-03-23 16:13:13 1178

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除