自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (6)
  • 收藏
  • 关注

转载 LSH

SimHash 参考:http://blog.csdn.net/heiyeshuwu/article/details/44117473 如下图,规定是多少位,对各个特征进行hash。将所有特征的进行累加。累加结果,若该位大于0则为1,小于0则为0。 可以基于海明距离还计算是否相似 还有查询的问题。空间换时间,取前若干位作为index MinHash 参考:http://blog.csdn.net/s

2015-08-29 23:33:58 622

原创 从DT到Random Forest、GBDT

决策树基础的内容,参考的链接: http://leijun00.github.io/2014/09/decision-tree/ ID3最基础的决策树,多叉树,仅能处理离散型值 采用信息增益来处理 g(D,A)=H(D)−H(D|A) 会偏向有较多属性的feature,容易过拟合 C4.5对ID3的改进 对于连续值,进行划分。假设是min,k1,k2,…,max的划分,依次尝试划分的方式,计算最佳

2015-08-29 23:16:35 1978

转载 [转]你应该掌握的七种回归技术

[转]你应该掌握的七种回归技术

2015-08-24 11:40:53 1882

原创 TextRank

关键字嗯,模型比较简单,限定一个窗口(比如一个词前后k个词,认为他们具有连接),然后计算PageRank 得到的就是这段话里的关键字,据说比TFIDF要靠谱点关键句主要也是句子间连接关系的限定,paper里计算句子的相似度: 然后一样计算: 看清楚累加的下标 Vj 是 In(Vi) 的集合,分母是 Out(Vj) 的集合参考信息参考1 参考2 代码 论文

2015-08-06 15:08:00 803

alphabeta剪枝算法的C++实现下棋程序

alphabeta剪枝算法的C++实现下棋程序。有注释,易理解。

2011-11-10

C++实现遗传算法GA(包含多种选择算子变异算子实现)

自己写的遗传算法代码,有注释,易理解。同时,强大之处,在于,里面将遗传算法一般用到的选择算子(轮盘赌、随机、锦标赛)等方式都进行了实现,以及加上多种的变异算子。是理解遗传算法,以及它的各种实现方式的好例子(自己吹嘘下,呵呵)。

2011-11-10

数据结构课程的C++行编辑器

数据结构课程的C++行编辑器,对字符串的处理,等等功能。有详细注释。

2011-11-10

huffman哈夫曼编码的C++实现

数据结构课上,自己使用C++实现的huffman哈夫曼编码。有注释,较易理解。

2011-11-10

基于JAVA、数据库架设旅游信息网站

本系统为开发数据库应用的系统,主要着重在于数据库的建立以及使用。在数据库使用方面,考虑到MySql与Java的良好兼容性等,使用了MySql来建立。在开发Web应用界面方面,使用MyEclipse软件,使用struts技术。 成功架设一个界面良好,功能强大的旅游信息网站。有较好的交互操作。 并且,具有doc文档介绍,包括设计以及使用的说明,详尽。

2011-05-24

剪枝算法的五子棋C++程序

使用C++编写的五子棋程序,算法用的是alpha-beta剪枝,用MFC的框架

2010-03-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除