自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(16)
  • 收藏
  • 关注

转载 将博客搬至CSDN

由于发现CSDN的博客现在做了不少改进,UI方面也越来越人性化了,现将博客搬迁至CSDN.地址为:http://blog.csdn.net/fy2462欢迎大家来参观。转载于:https://www.cnblogs.com/michaelGD/p/3774836.html...

2014-06-07 15:25:00 104

转载 基于余弦距离的的文本相似度挖掘(C++算法)

本文实现了根据余弦距离的文本相似度的C++实现算法,如要要点如下:1、对1998年1月的人民日报所有文章进行预处理(其中文件已经分化好分词),然后进行去噪声、去停用词等操作。2、对处理好的数据进行余弦计算,并存储为相应的数据结构。3、输出前N篇最相似的文章下面介绍Statistics.cpp,对预处理文件进行统计词频。 1 #pragma once 2 #...

2013-03-18 16:09:00 375

转载 数据库读写锁的C++实现

一、基本概念在数据库中,对某数据的两个基本操作为写和读,分布有两种锁控制:排它锁(X锁)、共享锁(S锁)。排它锁(x锁):若事务T对数据D加X锁,则其它任何事务都不能再对D加任何类型的锁,直至T释放D上的X锁; 一般要求在修改数据前要向该数据加排它锁,所以排它锁又称为写锁。共享锁(s锁):若事务T对数据D加S锁,则其它事务只能对D加S锁,而...

2013-01-24 14:21:00 205

转载 字符串移位包含问题

在编程之美3.1中,此题解法是用strstr()函数,并且以空间换时间,其实只要用循环遍历即可其时间复杂度: k < O(n) < k+ n, 其中k为查找串的长度,n为数据串的长度,空间复杂度为O(1)。代码如下: 1 #include<iostream> 2 using namespace std; 3 4 int findSu...

2012-12-20 21:42:00 136

转载 【转】强大的矩阵奇异值分解(SVD)及其应用

在工程实践中,经常要对大矩阵进行计算,除了使用分布式处理方法以外,就是通过理论方法,对矩阵降维。一下文章,我在学习SVD时发现的好文,推荐给大家,原始地址为:http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html原文如下:前言: 上一次写了关于PCA与LDA的文章...

2012-12-18 17:11:00 95

转载 ACE多线程服务器

ACE(Adaptive Communication Environment),它是一个面向对象的、跨平台的、开放源码的网络编程基础设施框架。 ACE 是由加利福尼亚大学Irvine分校的Douglas C.Schmidt 博士主导开发的,是一种跨平台可编译的网络编程API,并随后在工业界中发展、完善,它将底层的不同系统的细节透明化,为开发者提供统一的接口,从而可在不同...

2012-11-30 20:46:00 122

转载 最大公约数的快速求法

本题为编程之美中的第2.7题,上面的解法比辗转相除发的时间复杂度要小很多。看完之后用while循环代替了递归重写了一下。废话少说,上源码: 1 #include <iostream> 2 using namespace std; 3 4 int GDC(unsigned long long x, unsigned long long y) 5 {...

2012-11-28 15:56:00 344

转载 并查集的实现

1、概述  并查集(Disjoint set或者Union-find set)是一种树型的数据结构,常用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。2、基本操作  并查集是一种非常简单的数据结构,它主要未来解决如下两种经常性操作而产生的,分别为:  A. 合并两个不相交集合  B. 判断两个元素是否属于同一个集合(经常性)(1)合并两个不相...

2012-11-28 15:47:00 287

转载 找出出现次数最多的几个数值

这道题目所说的出现最多的几个数值,其实是带有附加条件的:  这几个数值中出现次数最少的那个数,要比除这几个值外的其他数的总个数要多。(说的自己都有点晕-_-!)这样才能在最后结果中,呈现这几个数。所以必须按照数据源中的统计量分析出求前几位的数值。其代码如下: 1 #include <iostream> 2 #include <hash_map&g...

2012-11-23 22:23:00 292

转载 寻找最大的K个数

这是一道很普遍和基础的题目,有很深的扩展性。一、首先,第一反应往往会想到快速排序后,再输出K个元素,但是时间复杂度为O(N*logN/log2) + O(K) = O(N*logN/log2)。 另外一种做法是,通过冒泡排序选出K个最大的出来,它的时间复杂度为O(N*K)。 这就要比较K < logN/log2 ? K : logN/lo...

2012-11-21 19:35:00 134

转载 决策树C4.5分类算法的C++实现

  公司布置了一个任务让写一个决策树,以前并未接触数据挖掘的东西,但作为一个数据挖掘最基本的知识点,还是应该有所理解的。  程序的源码可以点击这里进行下载,下面简要介绍一下决策树以及相关算法概念。  决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径...

2012-11-14 23:00:00 793

转载 在10进制和2进制中,从0到N总共包含1的数目

这是一道比较传统的面试题,自己写了个10进制的求1个数的程序,后来在《编程之美》中发现上面的解法更好一些,随后有用它的方法重写了一遍2进制下的求解方法。  程序源码请点击这里下载。  对于自己写的10进制程序:主要思想还是从前期的分析得出来的:  1、先统计N的相应位置所对应的累加和数组  2、从前到后,根据所当前位置对应的位数,进行累加,即:    1)...

2012-11-14 17:36:00 116

转载 【转】SVM算法入门

转自:http://www.blogjava.net/zhenandaci/category/31868.html(一)SVM的简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[10]。 支持向量机方法是建立在统...

2012-11-13 20:01:00 92

转载 【转】文本分类入门

来源 http://www.blogjava.net/zhenandaci/category/31868.html?Show=All文本分类入 门(一)文本分类问题的定义文本分类系列文章,从文本分类问题的定义开始,主要讲解文本分类系统的构成,主流的统计学习方法以及较为优秀的SVM算法及其改进。 一个文本(以下基本不区分“文本”和“文档”两个词的含义)分类问题就是将...

2012-11-13 20:00:00 168

转载 二叉树中查找两个节点的最低公共祖先

这是一道企业面试中,经常会被问到的面试题目。在网上看到一些此题的实现,其中有两种方法是比较适合编程的。本项目的源代码,请点击这里下载。方法一:  此方法是根据二叉树的DFS查找并标记祖先,根据递归出栈的原理,找到公共祖先。  其主要代码如下: 1 #include <iostream> 2 #include <list> 3 #in...

2012-11-12 19:27:00 106

转载 nutch安装与测试

一、nutch 介绍(来自百度百科) Nutch是一个由Java实现的,刚刚诞生开放源代码(open-source)的web搜索引擎。尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并且这很有可能进一步演变成为一个公司垄断了几乎所有的web搜索为其谋取商业利益.这显然不利于广大Internet用户.  Nutch为我们提供了这样一个...

2012-11-11 22:20:00 143

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除