java位图去重_海量数据去重排序bitmap(位图法)在java中实现的两种方法

海量数据去重排序bitmap(位图法)在java中实现的两种方法

发布于 2020-3-30|

复制链接

分享一篇关于关于海量数据去重排序bitmap(位图法)在java中实现的两种方法,小妖觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小妖来看看吧

在海量数据中查找出重复出现的元素或者去除重复出现的元素是面试中常考的文图。针对此类问题,可以使用位图法来解决。例如:已知某个文件内包含若干个电话号码,要求统计不同的号码的个数,甚至在O(n)时间复杂度内对这些号码进行排序。位图法需要的空间很少(依赖于数据分布,但是我们也可以通过一些放啊发对数据进行处理,使得数据变得密集),在数据比较密集的时候效率非常高。例如:8位整数可以表示的最大十进制数值为99999999,如果每个数组对应于一个bit位,那么把所有的八进制整数存储起来只需要:99Mbit = 12.375MB.实际上,java jdk1.0已经提供了bitmap的实现BitSet类,不过其中的某些方法是jdk1.4之后才有的。下面我先自己实现一下bitmap 的原理,然后再直接调用jdk的BitSet类分别实现bitmap, 方便比较理解:

```java

package swordoffer;

//去除重复并排序

import java.util.Arrays;

import java.util.BitSet;

import java.util.Random;

/**

* @author Gavenyeah

* @date Time:

* @des:

*/

public class BitMap {

int ARRNUM = 800;

int LEN_INT = 32;

int mmax = 9999;

int mmin = 1000;

int N = mmax - mmin + 1;

public static void main(String args[]) {

new BitMap().findDuplicate();

new BitMap().findDup_jdk();

}

public void findDup_jdk() {

System.out.println("*******调用JDK中的库方法--开始********");

BitSet bitArray = new BitSet(N);

int[] array = getArray(ARRNUM);

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
程序 = 数据结构 + 算  程序是为了解决实际问题而存在的。然而为了解决问题,必定会使用到某些数据结构以及设计一个解决这种数据结构的算。如果说各种编程语言是程序员的招式,那么数据结构和算就相当于程序员的内功。编程实战算,不是念PPT,我们讲的就是实战与代码实现与企业应用。程序 = 数据结构 + 算                ——灵奖得主,计算机科学家N.Wirth(沃斯)作为程序员,我们做机器学习也好,做python开发也好,java开发也好。有一种对所有程序员无一例外的刚需 —— 算数据结构日常增删改查 + 粘贴复制 + 搜索引擎可以实现很多东西。同样,这样也是没有任何竞争力的。我们只可以粘贴复制相似度极高的功能,稍复杂的逻辑没有任何办。语言有很多,开发框架更是日新月异3个月不学就落后我们可以学习很多语言,很多框架,但招聘不会考你用5种语言10种框架实现同一个功能。真正让程序员有区分度,企业招聘万年不变的点 —— 算数据结构。算代表程序员水平的珠穆朗玛。 本视频由微软全球最有价值专家尹成录制,拒绝念PPT,代码实战数据结构与算导论。除了传统数据结构算,加入高并发线程安全数据结构,分布式负载均衡算,分布式哈希表,分布式排序等等现代算。  算,晦涩难懂,却又是IT领域受视的素养之一。可以说,算能力往往决定了一个程序员能够走多远。因此,BAT/FLAG等国内外各大名企非常喜欢在面试环节考核求职者的算编程,这也成为了无数准程序员们过不去的一道“坎”。如何入门并成为一名出色的算工程师?但无论半路出家还是科班出身,除学生时代搞算竞赛的同学外真正用心学习过算数据结构太少太少。对于后期想要学习算数据结构却不得不面对以下问题:没有自己的知识框架,无关联知识点,学习效率低有疑问而无人解答,有问题无理解全靠猜测,一个问题卡好几天市面上资料题解质量参差不齐,正确性未可知Google算-工程师尹成大哥学习算

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值