自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

MachineRandy

不断追求进步、积极求索,努力做最优秀最充实的自己

  • 博客(12)
  • 收藏
  • 关注

原创 海量数据相似度搜索,如相似的网页、图像、文章、query 等相似性搜索

参考资料: https://blog.csdn.net/icvpr/article/details/12342159 局部敏感哈希(Locality-Sensitive Hashing, LSH)方法介绍 http://grunt1223.iteye.com/blog/964564 simhash与重复信息识别 http://www.07net01.com/2015/08/907327.ht...

2018-05-23 21:53:17 7014

原创 C++ 指针以及引用

参考资料: https://www.zhihu.com/question/37608201 c++中,引用和指针的区别是什么?指针:保存的是指向一个对象的内存的地址,通过这个地址,我们可以寻址到这块内存;因此,指针本身也是一个对象,占用内存。 引用:是一个变量的别名,本身不占用内存。引用在C++底层的实现上用的是指针。但是指针可以指向空(null) ,而引用不能为空,必须在定义的时...

2018-05-22 20:48:41 204

原创 维度灾难与降维 以及 PCA 主成分分析与 LDA 线性判别分析

参考资料: https://blog.csdn.net/m0_37788308/article/details/78115209 PCA主成分分析(入门计算+深入解析)(一) https://www.cnblogs.com/pinard/p/6251584.html 奇异值分解(SVD)原理与在降维中的应用 https://zhuanlan.zhihu.com/p/32658341 LDA...

2018-05-21 13:23:12 1266

原创 MapReduce 的Shuffle 过程、全排序以及数据倾斜的处理

参考文章: https://blog.csdn.net/u014374284/article/details/49205885 MapReduce shuffle过程详解 https://iclouding.github.io/2017/06/14/MapReduce%20%E5%85%A8%E6%8E%92%E5%BA%8F/ MapReduce 全排序 https://www.zhihu...

2018-05-20 15:56:09 1123

转载 ResNet, AlexNet, VGG, Inception: 理解各种各样的CNN架构(转载)

文章提到了 CNN 的优势,Dropout 为什么能防止过拟合,以及常见 CNN 的原理,值得一看!本文转载,传送门: https://zhuanlan.zhihu.com/p/32116277

2018-05-19 01:24:59 508

原创 Kmeans GMM 高斯混合模型 EM算法

Kmeans 模型是 GMM 模型的一种,高斯混合模型(Gaussian Mixed Model)指的是多个高斯分布函数的线性组合,理论上GMM可以拟合出任意类型的分布,通常用于解决同一集合下的数据包含多个不同的分布的情况。GMM 参数的学习可以用EM算法,EM算法是用于含有隐变量的概率模型参数的极大似然估计,EM算法通过迭代来的方式进行极大似然估计,每一次迭代由可以分为:E步,求期望;M步,...

2018-05-19 00:55:25 598

原创 JAVA 中 equals()与hashcode()

HashSet实现了Set接口,它不允许集合中有重复的值,当我们提到HashSet时,第一件事情就是在将对象存储在HashSet之前,要先确保对象重写equals()和hashCode()方法,这样才能比较对象的值是否相等,以确保set中没有储存相等的对象。如果我们没有重写这两个方法,将会使用这个方法的默认实现。equals()方法是用来判断其他的对象是否和该对象相等.equals()方法...

2018-05-18 12:55:27 160

原创 机器学习中的核技巧

核技巧、核函数真正接触核方法应该是在 SVM ,正常情况下,感知机算法和支持向量机都是默认数据是线性可分的,这类问题叫做线性分类问题。当数据线性不可分的时候,但高维可分(这个不理解可以多看看书),我们仍然想用线性分类的方法去解决,这个时候就需要用非线性变换将非线性问题转换成线性问题。于是,我们得到求解非线性分类问题的一个思路: 1. 用一个非线性变换,将数据特征从原空间映射到一个新的空间...

2018-05-18 01:47:50 3113

原创 Logistic 回归 (LR)推导

Logistic 回归是一个常用的分类模型以及神经网络的基础。二项逻辑斯谛回归 Logistic 回归的思想是将线性模型用来做分类任务,需要找到一个单调可微函数将分类任务的真实标记 yyy 与线性回归模型的预测值联系在一起(广义线性模型)。这里,我们选取一个可以代替单位阶跃函数(不连续)的函数即对数几率函数(Logistic function),它是一种 Sigmoid 函数即形似 SS...

2018-05-17 15:59:58 1029

转载 JAVA 加载、执行 JVM 以及 JAVA反射的较为基础直观的快速理解

详见一篇比较好的博文,没有联系转载,只能手动跳转了:深入理解java反射机制 https://blog.csdn.net/u012585964/article/details/52011138

2018-05-12 23:23:21 240

原创 Java中的String、StringBuilder、StringBuffer的区别

String 字符串常量 线程安全 因为是常量,所以是线程安全的,当我们修改 String 的时候,其实是创建了一个新的 String 对象,当需要频繁修改字符串的时候,不建议使用 String 因为当 JAVA 虚拟机堆中创建多了无引用的 String 对象之后,JAVA 垃圾回收器(GC)就会开始运行,程序也会因此变慢。StringBuilder 字符串变量 非线程安全 StringB...

2018-05-12 23:17:22 142

原创 C++ 大小写转换 与 位运算的 ^= 操作

C/C++ 中可以使用 isalpha (是否为字母),isdigit(是否为数字),islower(是否小写),isupper(是否大写),isalnum(是否为英文或数字) ,同时对于字母也可以使用 tolower 、toupper 进行大小写转换/*大小写转换*/int main(){ char c = 'a'; if(isalpha(a)){ ...

2018-05-10 16:29:33 2342

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除