数据结构
冲冲
哈哈,大家好,
展开
-
LinkLis javat的实现 双向链表的实现
package com.link;public class LinkedList { LinkNode header = null; LinkNode last = null; public LinkNode getFirstNode(){ return header; } public LinkNode getLastNode(){ return last;原创 2012-09-25 15:16:30 · 382 阅读 · 0 评论 -
tree的实现 java, 二叉树的实现
package com.link;import java.util.ArrayList;import java.util.Iterator;import java.util.List;public class Tree { private TreeNode root = new TreeNode(); private List nodes = new ArrayList()原创 2012-09-25 15:17:11 · 615 阅读 · 0 评论 -
外部排序技术之多路归并
重点:败者树的创建调整函数1.外部排序概述外部排序指的是大文件的排序,即待排序的记录存储在外存储器上,待排序的文件无法一次装入内存,需要在内存和外部存储器之间进行多次数据交换,以达到排序整个文件的目的。外部排序最常用的算法是多路归并排序,即将原文件分解成多个能够一次性装人内存的部分,分别把每一部分调入内存完成排序。然后,对已经排序的子文件进行归并排序。2. 多路归并的实现转载 2013-06-03 10:44:34 · 660 阅读 · 0 评论 -
TopK算法及实现 .
1. 问题描述 在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常称为“top K”问题,如:在搜索引擎中,统计搜索最热门的10个查询词;在歌曲库中统计下载率最高的前10首歌等等。2. 当前解决方案 针对top k类问题,通常比较好的方案是【分治+trie树/hash+小顶堆】,即先将数据集按照has转载 2013-06-03 11:02:47 · 702 阅读 · 0 评论 -
Top K
问题描述:(百度面试题)搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为0-255字节。假设目前有1000万个记录,除去重复后,不超过300万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门,请你统计最热门的10个查询串,要求内存不能超过1G。 问题解析: 【分析】:要统计最热门查询,首先就是要统计每个query出现的次数转载 2013-09-02 09:47:55 · 570 阅读 · 0 评论 -
百度最新面试题集锦
1、实现一个函数,对一个正整数n,算得到1需要的最少操作次数。操作规则为:如果n为偶数,将其除以2;如果n为奇数,可以加1或减1;一直处理下去。例子:func(7) = 4,可以证明最少需要4次运算n = 7n-1 6n/2 3n-1 2n/2 1要求:实现函数(实现尽可能高效) int func(unsign int n);n为输入,返回最小的运算次数。给出思路(转载 2013-09-02 10:23:17 · 659 阅读 · 0 评论 -
十道海量数据处理面试题与十个方法大总结
第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章算法里头有所提到,当时给出的方案是:IP的数目还是有限的,最多2^32个,所以可以考虑使用hash将ip直接存入内存,然后进行统计。 再详细介绍下此方案:首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32转载 2013-09-02 10:42:01 · 645 阅读 · 0 评论 -
常用hash算法及评测
常用hash算法及评测 [原创 2010-11-3 11:17:38]字号:大中 小 RS hash 算法unsigned int RSHash(char* str, unsigned int len){unsigned int b = 378551;unsigned int a = 63689;unsigned int ha转载 2013-11-23 21:57:16 · 650 阅读 · 0 评论 -
redis的排序 sort
本篇文章介绍下redis排序命令.redis支持对list,set和sorted set元素的排序。排序命令是sort 完整的命令格式如下:SORT key [BY pattern] [LIMIT start count] [GET pattern] [ASC|DESC] [ALPHA] [STORE dstkey] 下面我们一一说明各种命令选项(1)sort key这个是最简单的转载 2014-08-26 14:48:54 · 745 阅读 · 0 评论