scala实现Hash函数

在Spark GraphX计算中,为了提高效率,需要将字符串转化为正整数。本文介绍了使用Scala实现的BKDRHash函数,通过哈希算法将字符串转化为特定数字编号,避免了线性计算。在Scala中,由于没有unsigned int类型,使用hash & 0x7FFFFFFF进行转换。文章还提到了其他经典哈希算法的参考资料。
摘要由CSDN通过智能技术生成


在做spark graphx计算时,图的边表初始化,通常需要转化为 srcId,dstId,property 的形式,其中srcId,dstId 需要转化为数字以压缩数据,提高计算效率。即,在分布式spark程序中将字符串转化为正整数的问题。要想实现该功能,有两种方法,首先可以,先收集顶点表,然后逐个设置顶点编号,但是这种方法通常需要线性计算,费时费力。另外一种方法便是运用哈希函数的方式,把对应的字符串转化为特定数字编号,这样就能充分的利用集群的分布式计算能力。


经典的BKDRHash的Scala实现: 

def BKDRHash2( str:String) :Int ={
   val seed:Int  = 131 // 31 131 1313 13131 131313 etc..
   var hash:Int  = 0
   for(i <- 0 to str.length-1){
    hash = hash * seed + str.charAt(i)
    hash = hash & 0x7FFFFFFF
   

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值