自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(71)
  • 资源 (2)
  • 收藏
  • 关注

转载 Eclipse下搭建Hadoop2.4.0开发环境

一、安装Eclipse    下载Eclipse,解压安装,例如安装到/usr/local,即/usr/local/eclipse    4.3.1版本下载地址:http://pan.baidu.com/s/1eQkpRgu二、在eclipse上安装hadoop插件    1、下载hadoop插件        下载地址:http://pan.baidu.c

2015-04-13 09:54:17 555

转载 hadoop2.6.0的eclipse插件编译和设置

编译hadoop2.6.0的eclipse插件下载源码:git clone https://github.com/winghc/hadoop2x-eclipse-plugin.git编译源码:[html] view plaincopycd src/contrib/eclipse-plugin  ant ja

2015-04-13 09:52:48 576

转载 Hadoop上路_06-在Ubuntu中使用eclipse操作HDFS

目录[-]1.解压eclipse:2.安装hadoop开发插件: 3.执行快捷方式: 4.配置Hadoop视图:        1)window -> preferences -> Hadoop Map/Reduce,                      2)打开Hadoop视图,              3)新建Hadoop Location连接,  

2015-04-13 09:49:58 660

转载 ubuntu12.04 安装配置jdk1.7

第一步:下载jdk-7-linux-i586.tar.gzwget -c http://download.oracle.com/otn-pub/java/jdk/7/jdk-7-linux-i586.tar.gz  (注:如果下载不下来,建议使用迅雷下载,然后拷贝到Linux系统上。)第二步:解压安装sudo mkdir /usr/lib/jvm

2015-04-13 09:48:30 338

转载 取整数的最大值最小值值,

取整数的最大值最小值值,通常这两个常用是跟平台和操作系统有关的,不同的平台会有不同的值,因此可移植的办法就是推荐使用库函数提供的常量定义。(1)类似的常量定义在limits.h和float.h头文件中,可以查看源文件获取类似常量的使用办法。在头文件中,整数的最值通常是这样的名字:INT_MAX, INT_MIN,直接使用即可。(2)当然这两个最值完全可以通过编程实现:

2014-09-04 21:34:25 1210

原创 c++ I/0标准库

(1)转义字符\n 换行,移到下一行开头,ASII码是10,c++在windows下按Enter键实际上就是这个输入。\r回车,将移到当前行的开头\t水平制表\0 空字符(NULL)EOF 文件结束符,-1 是让cin变为bad()状态而已,windows下一般采用阻塞式检查ctr+z, Unix下一般是非阻塞式的检查Ctr+d,标准IO库Cin表示读入标准输入的ist

2014-09-03 22:10:38 625

转载 关于operator void*()和bool operator !()的一点理解

分类: c++2013-11-09 11:19 287人阅读 评论(0) 收藏 举报      C++中有特殊的两个操作符可以重载,分别是void* 和 !      先上代码:[cpp] view plaincopyclass A  {  public:    };    int main()  { 

2014-09-03 22:02:25 2230 1

转载 有两个数组a,b,大小都为n,;通过交换a,b中的元素,使sum(a)-sum(b)最小。

有两个数组a,b,大小都为n,;通过交换a,b中的元素,使sum(a)-sum(b)最小。有两个数组a,b,大小都为n,数组元素的值任意整形数,无序; 要求:通过交换a,b中的元素,使数组a元素的和与数组b元素的和之间的差最小。    当前数组a和数组b的和之差为    A = sum(a) - sum(b)    a的第i个元素和b的第j个元素交换后,

2014-09-02 23:54:33 839

转载 并查集(Union-Find) 应用举例 --- 基础篇

本文是作为上一篇文章 《并查集算法原理和改进》 的后续,焦点主要集中在一些并查集的应用上。材料主要是取自POJ,HDOJ上的一些算法练习题。首先还是回顾和总结一下关于并查集的几个关键点:以树作为节点的组织结构,结构的形态很是否采取优化策略有很大关系,未进行优化的树结构可能会是“畸形”树(严重不平衡,头重脚轻,退化成链表等),按尺寸(正规说法叫做秩,后文全部用秩来

2014-08-17 11:05:45 477

转载 并查集(Union-Find)算法介绍

本文主要介绍解决动态连通性一类问题的一种算法,使用到了一种叫做并查集的数据结构,称为Union-Find。更多的信息可以参考Algorithms 一书的Section 1.5,实际上本文也就是基于它的一篇读后感吧。原文中更多的是给出一些结论,我尝试给出一些思路上的过程,即为什么要使用这个方法,而不是别的什么方法。我觉得这个可能更加有意义一些,相比于记下一些结论。

2014-08-17 11:05:22 432

原创 全排列算法

void swap(int& a,int& b){int temp=a;     a=b; b=temp;}void printfPermutation(int Array[],int start,int length){if(start == (length-1)){for(int i=0;icout  cout  return;}

2014-08-14 21:02:21 452

转载 最近点对问题(分治)

在二维平面上的n个点中,如何快速的找出最近的一对点,就是最近点对问题。    一种简单的想法是暴力枚举每两个点,记录最小距离,显然,时间复杂度为O(n^2)。    在这里介绍一种时间复杂度为O(nlognlogn)的算法。其实,这里用到了分治的思想。将所给平面上n个点的集合S分成两个子集S1和S2,每个子集中约有n/2个点。然后在每个子集中递归地求最接近的点对。在这里,一个关键的

2014-08-08 23:09:02 636

转载 字符串的全排列和组合算法(转)

字符串的全排列和组合算法(转)全排列在笔试面试中很热门,因为它难度适中,既可以考察递归实现,又能进一步考察非递归的实现,便于区分出考生的水平。所以在百度和迅雷的校园招聘以及程序员和软件设计师的考试中都考到了,因此本文对全排列作下总结帮助大家更好的学习和理解。对本文有任何补充之处,欢迎大家指出。首先来看看题目是如何要求的(百度迅雷校招笔试题)。一、字符串的排列用C++写一个函

2014-07-22 10:37:44 549

转载 分布式系统CAP

在理论计算机科学中,CAP定理(CAP theorem),又被称作布鲁尔定理(Brewer's theorem),它指出对于一个分布式计算系统来说,不可能同时满足以下三点:[1][2]一致性(Consistency)(所有节点在同一时间具有相同的数据)可用性(Availability)(保证每个请求不管成功或者失败都有响应)分隔容忍(Partition tolerance)(系统中任意

2014-06-20 17:07:07 1412

转载 数据库ACID

数据库ACID 1、ACID是RDBMS的理论基石;     A原子(Atomiclty )事务原子性;     C一致(Consistency)插入一张表数据,会影响其它(索引/其它表)等一致。     I 隔离性(ioslation)事务独立,封闭;隔离性强度;     D持久性(Durabilty)数据永存。      对应分布式数据库

2014-06-20 14:47:45 564

转载 MongoDB 2.6发布—Kelly Stirman访谈

摘要: 对于NoSQL用户而言,MongoDB无需介绍了。MongoDB产品营销总监Kelly Stirman就最新的2.6稳定版回答了有关问题。最后,除其它更新外,我们还获得了关于集合级锁的进一步信息,它是MongoDB jira跟踪系统中受关注程度最 ...  对于NoSQL用户而言,MongoDB无需介绍了。MongoDB产品营销总监Kelly Stirman就最新的2.6稳定版回答

2014-06-11 16:00:42 536

转载 为首次部署MongoDB做好准备:容量计划和监控

如果你已经完成了自己新的MongoDB应用程序的开发,并且现在正准备将它部署进产品中,那么你和你的运营团队需要讨论一些关键的问题:最佳部署实践是什么? 为了确保应用程序满足它所必须的服务层次我们需要监控哪些关键指标? 如何能够确定添加分片的时机? 有哪些工具可以对数据库进行备份和恢复? 怎样才能安全地访问所有新的实时大数据?本文介绍了硬件选择、扩展、HA和监控。在查看详细信息之前,首先

2014-06-11 13:42:22 564

转载 MongoDB最新稳定版本2.2发布

摘要:经过近一年开发,MongoDB最新的稳定版2.2发布。重要的新特性包括:聚集框架、多数据中心支持、并发改进、TL集合和Shell改进等。MongoDB开发团队10gen的CTO Eliot Horowitz刚刚发表博客,宣布最新的稳定版(可以用于生产环境)MongoDB 2.2已经可以下载。距离上一个稳定版本2.0发布的2011年9月,将近一年。MongoDB是高性能开源文档

2014-06-11 13:26:25 981

原创 张善友(nosql)

点击打开链接

2014-06-11 10:29:06 663

转载 MongoDB2.6 新特性

MongoDB 2.6 已经在今天发布,当然,关注MongoDB的同志自然知道这个消息。整个MongoDB2.6,个人觉得认证系统是一个重新设计的系统。当然,MongoDB 2.4.6开始,就已经在尝试新的基于Role的认证方式了,但是真正的成熟还是在2.6.0这个版本。什么是基于角色Role的认证系统?在以往的MongoDB中,官方一直推荐MongoDB应该在一个Trust的环境下运

2014-06-10 16:19:09 549

转载 MongoDB释放2.4版本:692更新及8大得意之作

MongoDB释放2.4版本:692更新及8大得意之作摘要:继MongoDB 2.2版本推出后,10gen公司于3月19日释放了最新的MongoDB 2.4版本。对比旧版本,新版本足足做了692处更新,而其中更有8项10gen的得意之作。在2012年9月发布了MongoDB 2.2版本之后,10gen公司于2013年3月19日释放了最新的MongoDB 2.4版本。自发行以来,Mong

2014-06-10 16:16:20 612

原创 使用setup.py安装python包和卸载python包的方法

python很好用,尤其是用过easy_install的朋友更是觉得它的便捷,卸载命令也很简单 easy_install -m package-name但是面对源码安装的怎么办呢? setup.py 帮助你纪录安装细节方便你卸载python setup.py install --record log这时所有的安装细节都写到 log 里了想要卸载的时候cat log

2014-06-10 14:30:02 660

转载 [Solr] (源) Solr与MongoDB集成,实时增量索引

一. 概述   大量的数据存储在MongoDB上,需要快速搜索出目标内容,于是搭建Solr服务。  另外一点,用Solr索引数据后,可以把数据用在不同的项目当中,直接向Solr服务发送请求,返回xml、json等形式的内容,使得对数据的使用更灵活。   对于MongoDB与Solr的描述不在这里阐释了,本文旨在给大家提供整个Solr与MongoDB接合的方法,实现实时的增量索引

2014-06-10 13:13:59 861

原创 mongodb数组处理

点击打开链接

2014-06-09 17:09:43 460

转载 判断计算机的字节存储顺序是开序还是降序

bool IsBigendian(){ unsigned short usData=0x1122;

2014-06-08 09:41:39 769

转载 判断操作系统是16位还是32位的

这个问题有点模糊,因为用sizeof来判断等都是来测试的编译器的类型。不使用sizeof的方法:[cpp] view plaincopyprint?"font-family:Arial;color:#333333;">16位的系统下,  int i = 65536;  cout // 输出0;  int i = 65535

2014-06-08 09:36:36 648

原创 对两个有序的链表进行合并成一个一个有序链表(递归方法)

Node *MergeRecursive(Node *head1,Node *head2){if(head

2014-06-08 00:00:33 799

转载 大数四则运算的C++实现

大数四则运算的C++实现[摘要] 大数运算不仅仅运用在密码学中,还运用在一些物理学研究、生物学,化学等科目中。大数运算,意味着参加的值和计算结果通常是以上百位数,上千位数以及更大长度之间的整数运算。例如大家所熟知圆周率π的值,在一般的数值计算中用到圆周率的不须要多大的精度,但在计算一些星球或是星系上的体积面积时便显的误差很大了,这就要求π值计算的精度达到几百万位甚至更高,才能缩

2014-06-07 23:41:57 744

原创 把十进制数(long型)分别为二进制和十六进制形式输出,不能使用printf

//首先针对unsigned long进行处理//可以使用两种数据结构保存,一种使用栈,只需要每次向左移一位,然后进行位并操作//另一种使用数组,需要左右移位//十进制转换为二级制使用栈处理,stack* int_to_bin(unsigned long data){unsigned int  longSize=sizeof(unsigned long) ;//计算

2014-06-07 23:02:58 2362

原创 1000!末尾 有几个0

解题思路: 对1000!进行因式分解,假如有k个0,即10^k,分解2^k*5^k,由于1000!分解中2的个数多于5的个数,所以我们只要求出1000!分解中5出现的次数,就是末尾0的个数。可知被1-1000中能被5整除的数,都至少能分解出一个5,甚至可分解出两个5(例如:25,50,75............),三个5(例如:125,250,375,......),四个5(例如:625)

2014-06-07 20:44:05 1554 2

原创 五大常用算法:分治法,动态规划,贪心,回溯,分支限界法

点击打开链接

2014-06-05 23:38:56 785

原创 寒小阳

点击打开链接

2014-06-05 19:22:03 2924

转载 Solr从Mongodb索引数据(上

Solr从Mongodb索引数据(上) 借助mongodb-jdbc和配置JdbcDataSourceMongodb越来越流行,这边也用Mongodb去存储大量数据.但碰到一个问题,如何通过Solr从Mongodb中获取数据以及索引?Mongodb提供了DataImportHandler去索引数据,目前支持以下几种数据来源:JdbcDataSource,ContentStreamDataSou

2014-06-05 16:40:21 1111

原创 代震军BLOG

点击打开链接

2014-06-05 13:57:38 571

原创 结构之法 算法之道

点击打开链接

2014-06-05 13:55:13 544

转载 Linux下查看文件和文件夹大小

当磁盘大小超过标准时会有报警提示,这时如果掌握df和du命令是非常明智的选择。     df可以查看一级文件夹大小、使用比例、档案系统及其挂入点,但对文件却无能为力。    du可以查看文件及文件夹的大小。    两者配合使用,非常有效。比如用df查看哪个一级目录过大,然后用df查看文件夹或文件的大小,如此便可迅速确定症结。    下面分别简要介绍    df命令可以显示目前所

2014-06-05 11:26:21 416

转载 字符串相似度算法和最大公共子串提取算法

字符串相似度算法和最大公共子串提取算法1. Levenshtein Distance该算法又称之为 "编辑距离",用于计算两个字符串的相似程度。原理很简单,就是返回两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。次数越少,意味着字符串相似度越高。例如将 kitten 转换成 sittin

2014-06-03 22:19:35 1383

原创 TCP与UDP应用

首先还是把协议特性说一下,明白了特性自然知道应用场合了,嘿嘿!两种协议都是传输层协议,为应用层提供信息载体。TCP协议是基于连接的可靠协议,有流量控制和差错控制,也正因为有可靠性的保证和控制手段,所以传输效率比UDP低;UDP协议是基于无连接的不可靠协议,没有控制手段,仅仅是将数据发送给对方,因此效率比TCP要高。基于上述特性,不难得到结论,TCP协议适用于对效率要求相对低,但对准确性要求相对

2014-06-03 15:42:01 527

原创 哈希函数有关知识

一.哈希函数的构造方法

2014-06-01 17:11:06 1140 1

转载 Linux下的压缩解压缩命令详解

linux zip命令zip -r myfile.zip ./*将当前目录下的所有文件和文件夹全部压缩成myfile.zip文件,-r表示递归压缩子目录下所有文件.2.unzipunzip -o -d /home/sunny myfile.zip把myfile.zip文件解压到 /home/sunny/-o:不提示的情况下覆盖文件;-d:-d /home/s

2014-05-26 09:17:21 381

文本压缩算法的比较研究

文本压缩算法的比较研究, 压缩算法。文本压缩算法的比较研究, 压缩算法。文本压缩算法的比较研究, 压缩算法。文本压缩算法的比较研究, 压缩算法。

2013-12-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除