自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

搜索引擎

搜索

  • 博客(18)
  • 资源 (1)
  • 收藏
  • 关注

转载 [转载]内存分配 知识,全局,局部,静态变量

<br /><br />预备知识—程序的内存分配 <br />一个由C/C++编译的程序占用的内存分为以下几个部分 <br />1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。 <br />2、堆区(heap) — 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表,呵呵。<br />3、全局区(静态区)(static)—,全局变量和静态变量的存储是放在

2010-09-22 19:38:00 372

原创 public private protected三种标号

<br />#include<iostream>#include<string>//#include<vector>using namespace std;class Base{public: int j; int basemem( Base &b){ k = 1; //使用了k //k =b.k; error C2248: 'Base::k' : cannot access private member declared in class 'Base'

2010-09-22 11:36:00 453

原创 关于hadoob

<br />1. master节点出错,   通常由于临时文件(什么临时文件) 比较多 ,cpu比较占用率比较大;  备份master节点<br />2. work 节点出错<br />3。 调整  容量。。。 有balance  命令 控制HFS文件系统<br />4. second master<br />5.

2010-09-21 22:03:00 422

原创 一个人的实习

<br /> 持续近两个月的实习之旅基本结束,收获不小,最终拿到电信研究院,广州移动和IBM的offer,最近一直想写一下面巾,算是给自己的总结,前期找实习屡受BS,后期浙入佳境,验证RP守衡定律,赶紧发发面经,攒下RP。<br />1.微软:<br />    微软四月份就开始招实习了,是几大公司里面来得最早的。本来是抱着去打打酱油,锻炼锻炼的态度想去试一下微软的笔试;于是在网上投简历,到了发笔试通知的时候才发现竟然忘了在网上提交简历,这还是我第一个投简历的公司,看来态度不端正,以后要认真点了

2010-09-21 11:59:00 1430

原创 百度 2

<br />一、选择题:15 分 共 10 题<br />1. 已知一个线性表(38,25,74,63,52,48),采用的散列函数为 Hash($Key)=$Key mod 7,将元素散列到表长为7的哈希表中存储。请选择后面两种冲突解决方法分别应用在该散列表上进行等概率成功查找的平均查找长度,拉链法 ,线性探测法 .<br />A. 1.0 B. 1.5 C. 1.7 D. 2.0 E. 2.3<br />F. 7/6 G. 4/3 H. 3/2<br /><br />2. 需要将OS

2010-09-20 16:02:00 741

原创 百度3

1)此题10分 <br />对任意输入的正整数N,编写C程序求N!的尾部连续0的个数,并指出计算复杂度。如:18!=6402373705728000,尾部连续0的个数是3。 <br />(不用考虑数值超出计算机整数界限的问题) <br /><br />2)此题10分 <br />编写一个C语言函数,要求输入一个url,输出该url是首页、目录页或者其他url <br />如下形式叫做首页: <br />militia.info/ <br />www.apcnc.com.cn/ <

2010-09-20 16:02:00 1461

原创 baidu

<br />2. (15 分)下面一段代码,想在调用 f2(1) 时打印 err1,调用 f2(2) 时打印 err4,但是代码中有一些问题,请做尽可能少的修改使之正确。<br />1 static int f1( const char *errstr, unsigned int flag ) {<br />2   int copy, index, len;<br />3   const static char **__err = { "err1", "err2", "err3", "err4"

2010-09-20 16:01:00 325

原创 一些百度答案

<br />一、选择题:15分 共10题 <br />1.    在排序方法中,关键码比较次数与记录地初始排列无关的是    . D<br />A. Shell排序      B. 归并排序       C. 直接插入排序        D. 选择排序 <br /><br />2.    以下多线程对int型变量x的操作,哪几个需要进行同步: ABC<br />A. x=y;         B. x++;         C. ++x;            D. x=1; <br /><

2010-09-20 15:49:00 438

原创 一些题目

<br />1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?<br />方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。<br />s 遍历文件a,对每个url求取,然后根据所取得的值将url分别存储到1000个小文件(记为)中。这样每个小文件的大约为300M。<br />s 遍历文件b,采取和a相同的方式将url分别存储到1000各小

2010-09-09 14:47:00 341

原创 DP (Dynamic programming)

<br />1. Fibonacci数列<br />F(0) = 1, F(1) = 1<br />F(n+1) = F(n)+F(n-1)<br /><br />最方便的方法当然是递归,但递归对堆栈需求很大。最小内存使用只需要两个变量<br />int F(int n) <br />{ <br />    int a=1, b=1, t; <br />    if( n ==0 || n ==1) return 1; <br />    for( int i=

2010-09-07 09:47:00 623

原创 海量数据处理2

<br />这篇翻译不错,抄在这里免得下次想给人看找不到<br />Map / Reduce<br />有一天,你在浏览自己的代码,发现有两大段代码几乎一样。实际上,它们确实是一样的——除了一个关于意大利面(Spaghetti)而另一个关于巧克力慕思(Chocolate Moose)。  <br />  // 一个小例子: <br />  alert("偶要吃意大利面!"); <br />  alert("偶要吃巧克力慕思!"); <br />嗯,这个例子碰巧是用ja

2010-09-07 09:45:00 709

原创 海量数据处理

<br />1. heap sort与median of median quick sort<br />[问题]空间有N个点,如何求出离点p0最近的K个点?<br />[答案1]首先当然是算出各点到p0的距离。一边算一边构造一个K大小的max heap(这里heap是堆排序中的heap的意思)。heap满了以后每次把max挤出堆。复杂度N*logK.<br />[答案2]在CLRS的书《Introduction to Algorithms》的第9.3章,介绍了一个把数组分成5个5个的小区间,用media

2010-09-07 09:44:00 492

原创 转发一篇好文章, 海量数据处理

最近有点忙,稍微空闲下来,发篇总结贴。 大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到。 下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎与我讨论。 1.Bloom filter适用范围:可以用来实现数据字典,进行数据的判重,或

2010-09-07 09:42:00 401

原创 c++prime笔记一

<br />C++为类中提供类成员的初始化列表<br />类对象的构造顺序是这样的:<br />1.分配内存,调用构造函数时,隐式/显示的初始化各数据成员<br />2.进入构造函数后在构造函数中执行一般计算<br /><br />使用初始化列表有两个原因:<br />1.必须这样做:<br />        如果我们有一个类成员,它本身是一个类或者是一个结构,而且这个成员它只有一个带参数的构造函数,而没有默认构造函数,这时要对这个类成员进行初始化,就必须调用这个类成员的带参数的构造函数,如果

2010-09-04 10:53:00 422

转载 倒水问题

<br />倒水问题的经典形式是这样的:<br /><br />“假设有一个池塘,里面有无穷多的水。现有2个空水壶,容积分别为<br />5升和6升。问题是如何只用这2个水壶从池塘里取得3升的水。”<br /><br />当然题外是有一些合理的限制的,比如从池塘里灌水的时候,不管壶<br />里是不是已经有水了,壶一定要灌满,不能和另一个壶里的水位比照<br />一下“毛估估”(我们可以假设壶是不透明的,而且形状也不同);<br />同样的,如果要把水从壶里倒

2010-09-01 16:44:00 784

原创 海盗分金问题

<br />    海盗,大家听说过吧。这是一帮亡命之徒,在海上抢人钱财,夺人性命,干的是刀头上舔血的营生。在我们的印象中,他们一般都瞎一只眼,用条黑布或者讲究点的用个黑皮眼罩把坏眼遮上。他们还有在地下埋宝的好习惯,而且总要画上一张藏宝图,以方便后人掘取。不过大家是否知道,他们是世界上最民主的团体。参加海盗的都是桀骜不驯的汉子,是不愿听人命令的,船上平时一切事都由投票解决。船长的唯一特权,是有自己的一套餐具——可是在他不用时,其他海盗是可以借来用的。船上的唯一惩罚,就是被丢到海里去喂鱼。 <

2010-09-01 16:34:00 363

转载 决策树的原理

<br />决策树方法最早产生于上世纪60年代,到70年代末。由J RossQuinlan提出了ID3算法,此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进,对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进,既适合于分类问题,又适合于回归问题<br />    这里 介绍其基本原理 和一个实验例子。<br />    先介绍2个算法:<br />    算法一:熵(entropy)<br />    熵(ent

2010-09-01 16:26:00 1528

转载 spider技术综述

<br />Spider系统是搜索引擎当中进行互联网上数据采集的一个核心子系统。在这个子系统当中,通常先种入一批种子Url,Spider对这些种子Url采集之后将链接提取入库,然后再对新入库的Url进行采集,并且负责对采集过的Url进行更新采集,如此循环。<br />    随着各种垂直搜索引擎的不断发展,整个Spider在功能上又分为传统的收集互联网上所有数据的大Spider和服务于某个专门领域的聚焦Spider。两类Spider的不同之处在于,后者需要一个过滤器来过滤掉那些专门领域不要的Ur

2010-09-01 16:08:00 499

Heritrix+lucene开发自己的搜索引擎

Lucene全文搜索引擎的应用, 讲解如何使用Lucene全文搜索引擎的应用

2010-08-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除