自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(49)
  • 资源 (2)
  • 收藏
  • 关注

转载 使用 PHPUnit 和 Selenium 进行测试

http://netbeans.org/kb/docs/php/phpunit_zh_CN.html#installing-phpunit适用于 PHP 的 NetBeans IDE 支持 PHPUnit 自动测试。通过 PHPUnit,NetBeans IDE 可为 PHP 提供代码覆盖率,这与 IDE 为 Python 提供的代码覆盖率类似。测试输出将显示在功能丰富的输出窗口中,该窗口

2013-03-19 10:22:20 648

原创 数据挖掘测试数据集大全

常用的基本上UCI和w3c的。关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:http://www.cs.waikato.ac.nz/ml/weka/UCI收集的机器学习数据集ftp://pami.sjtu.edu.cnhttp://www.ics.uci.edu/~mlearn/\\MLRepository.h

2012-06-01 14:10:21 1092

转载 c/C++内存分配

一、预备知识—程序的内存分配一个由c/C++编译的程序占用的内存分为以下几个部分1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。2、堆区(heap) — 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表,呵呵。3、全局区(静态区)(s

2012-05-27 20:16:50 375

转载 new和malloc的区别和联系

1、new 是c++中的操作符,malloc是c 中的一个函数2、new 不止是分配内存,而且会调用类的构造函数,同理delete会调用类的析构函数,而malloc则只分配内存,不会进行初始化类成员的工作,同样free也不会调用析构函数3、内存泄漏对于malloc或者new都可以检查出来的,区别在于new可以指明是那个文件的那一行,而malloc没有这些信息。4、new 和 mallo

2012-05-27 20:07:12 257

转载 【引用酷壳】C++11 中值得关注的几大变化(详解)

源文章来自前C++标准委员会的 Danny Kalev 的 The Biggest Changes in C++11 (and Why You Should Care),赖勇浩做了一个中文翻译在这里。所以,我就不翻译了,我在这里仅对文中提到的这些变化“追问为什么要引入这些变化”的一个探讨,只有知道为了什么,用在什么地方,我们才能真正学到这个知识。而以此你可以更深入地了解这些变化。所以,本文不是

2012-05-27 19:47:36 369

转载 理解extern "C"

关于extern “C”的来龙去脉,摘录的三篇网友文章,如下:http://www.yuanma.org/data/2006/0830/article_1438.htm1、  引言C++语言的创建初衷是“a better C”,但是这并不意味着C++中类似C语言的全局变量和函数所采用的编译和连接方式与C语言完全相同。作为一种欲与C兼容的语言,C++保留了一部分过程式语言的特点(被世人称

2012-05-27 16:45:57 341

转载 C++:new运算符和new表达式详解

摘要:在C++中new是一个行为和语法都有点诡异的结构,它的语法上与其它C++语法不同,它在语义上却也经常引起人们的不解,尤其当用户自定义的new在使用的时候。本文试图回答作者在学习new的时候遇到的问题,同时这些问题也可能是大多数人首先遇到的问题。目录 [隐藏]new 关键字new 运算符new 表达式new 关键字new是C++的关键字,它不仅仅

2012-05-27 14:59:28 8268 2

转载 const限定修饰符用法总结(常量,指针,迭代器,函数参数,成员函数)

在这里总结一下const限定修饰符的各种用法,都已经过vs2010测试。1)  声明及初始化const常量。在声明一个const常量时,必须对其初始化,否则会报错。1 const int constvar; //error2 const int constvar = 10; //ok但是,有一个例外的情况,就是extern进来的const常量不需要

2012-05-15 20:56:23 398

转载 ProtoBuf开发者指南

1   概览1.1   什么是protocol buffer1.2   他们如何工作1.3   为什么不用XML?1.4   听起来像是为我的解决方案,如何开始?1.5   一点历史2   语言指导2.1   定义一个消息类型2.2   值类型2.3   可选字段与缺省值2.4   枚举2.5   使用其他消息类型2.6   嵌套类型2.7   更新一个数据类型2.8   扩展

2012-04-01 11:32:56 369

转载 Hadoop中Partition解析

1.解析PartitionMap的结果,会通过partition分发到Reducer上,Reducer做完Reduce操作后,通过OutputFormat,进行输出,下面我们就来分析参与这个过程的类。Mapper的结果,可能送到Combiner做合并,Combiner在系统中并没有自己的基类,而是用Reducer作为Combiner的基类,他们对外的功能是一样的,只是使用的位置和使用时的上

2012-03-19 20:17:10 422

转载 c++模板类(1) 理解编译器的编译模板过程

如何组织编写模板程序前言常遇到询问使用模板到底是否容易的问题,我的回答是:“模板的使用是容易的,但组织编写却不容易”。看看我们几乎每天都能遇到的模板类吧,如STL, ATL, WTL, 以及Boost的模板类,都能体会到这样的滋味:接口简单,操作复杂。我在5年前开始使用模板,那时我看到了MFC的容器类。直到去年我还没有必要自己编写模板类。可是在我需要自己编写模板类时,我首先遇到

2012-03-06 10:41:18 322

原创 关于g++编译模板类的问题

写了一个线性表的模板,类如下:"List.h"template class List{};"AList.h"template class AList : public List{};本来讲AList的实现和声明分离了,实现写在AList.cc文件中而main.cc中用到 AList alist;makefile文件如下:Complier=g++Alist

2012-03-06 10:37:58 1158

原创 hadoop 0.20.2在eclipse开发的插件问题

我使用的是eclipse 3.7,开始使用的插件是hadoop-0.20.2文件夹下/contrib下的eclipse插件hadoop-0.20.2-eclipse-plugin.jar,配置完eclipse后,出现了run on hadoop没反应,后来看了网上一篇文章:http://hi.baidu.com/laxinicer/blog/item/fbaddaf58bdae63fbc310

2012-03-03 09:38:16 3438 4

转载 hadoop-0.20.2安装及简单使用

我是初学者,文章只是记录我的学习过程,有很多不足或是错误,请大家谅解并指正,真心希望多和大家交流~安装步骤如下:1.1 机器说明总共有4台机器:sc706-26、sc706-27、sc706-28、sc706-29IP地址分别为:192.168.153.89、192.168.153.90、192.168.153.91、192.168.153.92操作系统为:Linux的fedo

2012-03-02 13:42:40 1024

转载 Hadoop常见问题及解决办法

1:Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-outAnswer:程序里面需要打开多个文件,进行分析,系统一般默认数量是1024,(用ulimit -a可以看到)对于正常使用是够了,但是对于程序来讲,就太少了。修改办法:修改2个文件。       /etc/security/limits.con

2012-03-01 09:19:29 1016

转载 hadoop学习笔记(1) 开发环境

刚开始学习hadoop,首先搭建了一下开发环境,最开始是在单独编写Map-Reduce程序,然后在命令行编译,再通过hadoop命令运行打好的jar包,虽然也能够运行,但是总感觉这样用起来很麻烦,所以今晚又尝试了直接通过eclipse来编辑和运行Map-Reduce程序,瞎弄了一下,居然让我弄成功了,自然走了点弯路,担心以后再走弯路,所以把自己的搭建过程记录于此。1.准备1.1 软件r

2012-02-28 15:32:35 508

转载 hadoop学习笔记(2) 伪分布模式配置

前面介绍了linux下hadoop的安装和简单配置,主要是独立模式的配置,所谓独立模式是指不需要运行任何守护进程(daemon),所有程序都再单个JVM上执行,由于在独立模式下测试和调试MapReduce程序较为方便,因此该模式适合用在开发阶段。这里主要记录了本人配置hadoop伪分布模式的过程。所谓伪分布模式是在单机上模拟Hadoop分布式,单机上的分布式并不是真正的分布式,而是使用java

2012-02-28 15:31:39 536

转载 Linux(Centos)配置OpenSSH无密码登陆

最近在搭建Hadoop环境需要设置无密码登陆,所谓无密码登陆其实是指通过证书认证的方式登陆,使用一种被称为"公私钥"认证的方式来进行ssh登录。  最近在搭建Hadoop环境需要设置无密码登陆,所谓无密码登陆其实是指通过证书认证的方式登陆,使用一种被称为"公私钥"认证的方式来进行ssh登录。  " 公私钥"认证方式简单的解释:首先在客户端上创建一对公私钥 (公钥文件:~/.ssh/id_r

2012-02-28 14:43:58 490

转载 Boost_1_47_0+STLpor+VS2005终于编译成功

搞了好几天今天晚上终于编译成功了,全部编译通过,2946个哈,1、准备工作(STLport5.2.1,Boost_1_47_0)   下载STLport,boost库,空间预留多一点至少5个G吧,boost的lib有1.35GB,bin-v2是临时文件(有好几G),编译完了就可以删掉了。2、STLport配置   用记事本打开C:\Program Files\Microso

2012-02-12 18:02:21 710

转载 mapreduce网址

http://blog.sina.com.cn/u/1243568575

2011-12-16 18:00:39 480

转载 让你的MapReduce SQL引擎加速 ---- Google-Tenzing下的那些Tricks

让你的MapReduceSQL引擎加速           ---- Google-Tenzing下的那些TricksTenzing:在Google-MapReduce计算框架之上实现对SQL的支持,Tenzing是SQL engine forMapReduce framework。Motivation:分布式数据库提供的SQL查询的不足:1)节点扩展的问题2)

2011-12-16 17:59:01 2893

转载 Hadoop0.23.0初探4---让你的第一个YARN MapReduce跑起来

前言klose的Hadoop0.23.0初探的系列文章的前三篇分别介绍了:Hadoop的变迁的前因后果、HDFSFederation的配置、以及HDFS的NN、SNN、BN和HA之间的关系。第四篇为文章稍微减负以下,主要介绍Yarn的部署,以及跑第一个HelloWorld(MapReducewordcount)。YARN框架介绍MapReduce跑起来" title="Hadoop0.

2011-12-16 17:58:03 768

转载 Hadoop0.23.0初探3---HDFS NN,SNN,BN和HA

前言保证HDFS高可用是Hadoop被推广以来很多技术人员一直关心的问题,通过搜索引擎搜索也可以得到很多的方案。恰逢HDFSFederation出炉,本文将一些涉及到有关NameNode、SecondaryNameNode、BackupNode的含义与区别,以及HDFSHA框架做一个总结。除此之外,文章的最后,将介绍Hadoop-0.23.0如何配置NameNode、SecondaryName

2011-12-16 17:57:07 756

转载 Hadoop0.23.0初探2---HDFS Federation部署

Hadoop的目录文件结构:.|-- LICENSE.txt|-- NOTICE.txt|-- README.txt|-- bin|-- conf|-- etc|-- export_hadoop.sh|-- hadoop-0.23.0-gridmix.jar|-- hadoop-0.23.0-streaming.jar|-- hadoop-mapredu

2011-12-16 17:55:35 355

转载 Hadoop0.23.0初探1---前因后果

最近Hadoop社区最火热的事情莫过于Hortonworks公布了Hadoop最新版本(0.23.0),它标志着Hadoop新时代的到来。本文作为系列文章的第一篇,将结合Hadoop-0.20.*的特点,以及Hadoop核心理念,分析Hadoop新版本的特征。1、Hadoop 0.20.*的局限性HDFS单NameNode的不足   1)扩展性问题。可以随着数据量进行水平扩展,

2011-12-16 17:54:13 507

转载 Fedora15 默认OpenJDK与SunJDK互相切换(转)

1.查看系统提供的JDK版本信息(可以看到默认安装了OpenJDK)1[etan@ethan eclipse]$ /usr/sbin/alternatives --configjava23共有 2 个提供“java”的程序。4

2011-12-10 16:07:21 528

转载 linux下makefile详解一(转csdn)

陈皓 (CSDN)概述——什么是makefile?或许很多Winodws的程序员都不知道这个东西,因为那些Windows的IDE都为你做了这个工作,但我觉得要作一个好的和professional的程序员,makefile还是要懂。这就好像现在有这么多的HTML的编辑器,但如果你想成为一个专业人士,你还是要了解HTML的标识的含义。特别在Unix下的软件编译,你就不能不自己写makefi

2011-12-05 21:16:26 306

转载 一些有意思的算法代码

http://coolshell.cn/articles/6010.html Keith Schwarz是一个斯坦福大学计算机科学系的讲师。他对编程充满了热情。他的主页上他自己正在实现各种各样的有意思的算法和数据结构,http://www.keithschwarz.com/interesting/, 目前这个网页上有88个(见下面的列表),但这位大哥要干135个,你可以看看他的To-D

2011-11-29 13:53:31 566

转载 计算机会议排名:Computer Science Conference Rankings- -

Note:I will NOT update this general list any more in the future. Instead, I'm maintaining a list of computer security conference ranking and statistic.As we all know, conference is more im

2011-11-05 23:37:30 1306

转载 一些博客

小博的主题定位在专业有效的商务图表,不少朋友希望我能推荐一些类似主题的博客,其实我自今年才开始接触博客这个事物,了解也不多。在网上搜索,发现类似的专门主题中文博客非常少。不过,这1年的博客经历,我也认识了几位博友,今天整理在一起,成为:数据分析人士的中文博客资源,聊作回复。

2011-10-07 12:15:23 502

转载 十七道海量数据处理面试题与Bit-map详解

作者:小桥流水,redfox66,July。文章性质:整理。链接:http://blog.csdn.net/v_july_v/article/details/6685962本博客内曾经整理过有关海量数据处理的10道面试题(十道海量数据处理面试题与十个方

2011-10-07 10:40:59 328

转载 用GDB调试程序(七)

改变程序的执行———————    一旦使用GDB挂上被调试程序,当程序运行起来后,你可以根据自己的调试思路来动态地在GDB中更改当前被调试程序的运行线路或是其变量的值,这个强大的功能能够让你更好的调试你的程序,比如,你可以在程序的一次运行中走遍程序的所有分支。

2011-09-20 11:12:54 301

转载 用GDB调试程序(六)

七、设置显示选项    GDB中关于显示的选项比较多,这里我只例举大多数常用的选项。    set print address     set print address on         打开地址输出,当程序显示函数信息时,GDB会显出函数的参数地址。系统默

2011-09-20 11:12:11 186

转载 用GDB调试程序(五)

查看运行时数据———————        在你调试程序时,当程序被停住时,你可以使用print命令(简写命令为p),或是同义命令inspect来查看当前程序的运行数据。print命令的格式是:        print     print /

2011-09-20 11:11:37 243

转载 用GDB调试程序(四)

查看栈信息—————当程序被停住了,你需要做的第一件事就是查看程序是在哪里停住的。当你的程序调用了一个函数,函数的地址,函数参数,函数内的局部变量都会被压入“栈”(Stack)中。你可以用GDB命令来查看当前的栈中的信息。下面是一些查看函数调用栈信息的GDB命令:

2011-09-20 11:10:40 192

转载 用GDB调试程序(三)

四、维护停止点上面说了如何设置程序的停止点,GDB中的停止点也就是上述的三类。在GDB中,如果你觉得已定义好的停止点没有用了,你可以使用delete、clear、disable、enable这几个命令来进行维护。    clear        清除所有的已定义的停止

2011-09-20 11:09:50 183

转载 用GDB调试程序(二)

GDB的命令概貌———————启动gdb后,就你被带入gdb的调试环境中,就可以使用gdb的命令开始调试程序了,gdb的命令可以使用help命令来查看,如下所示:    /home/hchen> gdb    GNU gdb 5.1.1    Copyrigh

2011-09-20 11:08:43 193

转载 用GDB调试程序(一)

说明 从CSDN的网站上找到的GDB使用说明。 原文标题:用GDB调试程序作者:haoel (QQ是:753640,MSN是: haoel@hotmail.com)关键字:gdb 调试 c c++ gun这篇文章非常好,所以转载了下来,作为收藏。

2011-09-20 11:07:34 210

转载 Linux基础命令

1. man 对你熟悉或不熟悉的命令提供帮助解释eg:man ls 就可以查看ls相关的用法注:按q键或者ctrl+c退出,在linux下可以使用ctrl+c终止当前程序运行。2. ls 查看目录或者文件的属*,列举出任一目录下面的文件eg: ls

2011-09-18 21:27:01 204

转载 makefile例子

假设我们有一个程序由5个文件组成,源代码如下:/*main.c*/#include "mytool1.h"#include "mytool2.h"int main(){    mytool1_print("hello mytool1!");    my

2011-09-18 21:25:33 254

aprioriC++MFC代码

数据挖掘apriori代码,利用map、set结合编写,包括可以挖掘频繁1项集,频繁k项集,关联规则挖掘

2010-05-10

数据结构大作业--池塘夜雨--mfc

数据结构大作业------池塘夜雨,用MFC编写 利用链表结构 功能强大,共享大家

2009-08-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除