- 博客(2)
- 收藏
- 关注
原创 [数据结构]这可能是你见过最简单的HashMap
Hash:散列 优势:HashMap是ArrayList和LinkedList的折中版,结合了查询快,插入快的优点。HashMap为什么查询快? Hash中重要的思想就是把数据分散化,引入了bucket(桶)的概念,把空间分为桶,默认16个桶 众所周知HashMap是基于key-value映射的,而key是唯一的,怎么决定key进入到哪个桶里呢? ...
2018-02-25 15:43:07 226
原创 [hadoop]什么是数据倾斜?如何解决数据倾斜?
导读相信很多接触MapReduce的朋友对'数据倾斜'这四个字并不陌生,那么究竟什么是数据倾斜?又该怎样解决这种该死的情况呢?何为数据倾斜?在弄清什么是数据倾斜之前,我想让大家看看数据分布的概念: 正常的数据分布理论上都是倾斜的,就是我们所说的20-80原理:80%的财富集中在20%的人手中, 80%的用户只使用20%的功能 , 20%的用户贡献了80%的访问量 , 不同的数据字段可能的数据...
2018-02-24 23:19:18 7081 5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人