海量数据管理
文章平均质量分 58
求职之道
关注程序员求职中的各类问题,包括面试笔试中的各类技术问题与非技术问题。
展开
-
程序员求职之道(《程序员面试笔试宝典》)
21世纪的前10年是IT技术迅速发展的10年,嵌入式技术、互联网技术等蓬勃发展,程序员,尤其是高级程序员可观的薪水以及程序员巨大的发展潜力使得越来越多的人选择了程序员作为未来的职业。同时,由于计算机技术自身博大精深,涉及的知识面很广,企业在给程序员开出高薪的同时,对他们的专业素养也提出了非常高的要求。每年九月份开始,各大IT企业开始招兵买马,招贤纳士,无数具有计算机专业背景的学生都希望在招聘季能够原创 2012-07-14 23:45:35 · 6207 阅读 · 3 评论 -
程序员求职之道(《程序员面试笔试宝典》)之海量数据处理(排序问题)?
海量数据处理中一类常见的问题就是排序问题,即对海量数据中的数据进行排序,例如,一个文件中有9亿条不重复的9位整数,对这个文件中数字进行排序。针对这个问题,最容易想到的方法是将所有数据导入到内存中,然后使用常规的排序方法,例如插入排序、快速排序、归并排序等各种排序方法对数据进行排序,最后将排序好的数据存入文件。但这些方法却不能在此适用,由于数据量巨大,在32位机器中,一个整数占用4个字节,而9亿原创 2012-08-19 20:48:40 · 2127 阅读 · 0 评论 -
程序员求职之道(《程序员面试笔试宝典》)之海量数据处理(如何从10亿查询词找出出现频率最高的10个)?
1. 问题描述在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常称为“top K”问题,如:在搜索引擎中,统计搜索最热门的10个查询词;在歌曲库中统计下载率最高的前10首歌等等。2. 当前解决方案针对top k类问题,通常比较好的方案是【分治+trie树/hash+小顶堆】,即先将数据集按照hash方法分解成原创 2012-08-10 20:03:08 · 2495 阅读 · 1 评论 -
程序员求职之道(《程序员面试笔试宝典》)之如何回答系统设计题?
应届生在面试的时候,偶尔也会遇到一些系统设计题,而这些题目往往只是测试一下求职者的知识面,或者测试求职者对系统架构方面的了解,一般不会涉及到具体的编码工作。虽然如此,对于此类问题,很多人还是感觉难以应对,也不知道从何说起。原创 2013-10-13 20:52:08 · 2568 阅读 · 0 评论 -
《程序员面试笔试宝典》(第二版)终于在万众期待中出版啦~
《程序员面试笔试宝典》(第二版)终于在万众期待中出版啦~它是知名畅销书《程序员面试笔试宝典》的第二版、《Java程序员面试笔试宝典》的姊妹篇,而定价只要44元哦,希望本书的出版能够让更多的求职者能够走进理想的企业。原创 2015-01-13 21:59:58 · 4057 阅读 · 1 评论