使用hash方法切割文件

如果有大型数据文件(如每行为url或者ip或者单词等的),以G为单位的,处理的时候需先切分。普通切分方法直接根据数据条数切分,得到的每个文件大小相近。

但是有时需要将相同数据放到相同文件中。可以使用hash切分法。

public class Test {
	
	static int HASHLEN = 1000;
	
	public static void main(String[] args) {
		// TODO Auto-generated method stub
		String words [] = {"yes" ,"an" ,"go"};
		for(String word:words){
			int temp = hash(word.toCharArray());
			System.out.println(temp);
		}
	}
	public static int hash(char[] word) {
	    int index = 0; 
	    int i=0;
	    while(i<word.length) {
	        index += index * 31 + word[i];  
	        i++;
	    }  
	    return index % HASHLEN;  
	}  
}
相同单词一定得到相同的返回值,不同单词也可能得到相同返回值

转载于:https://www.cnblogs.com/yan456jie/p/5369545.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值