hash trick
哈希函数的特征:
哈希表固定长度为2**28大小,通过hash函数映射成每个单调均映射到一个在[0,2**28)范围内的一个索引值;
一开始还不好理解,将2**28认为是词汇表的大小,其实这是哈希函数映射的一个表;所有单词均会被映射到该范围中;
2**28还是太高了,所以一开始就认为是词汇表的大小;这里应该定义成更小才不会被误解;比如128,64等等
案例:
hash trick
哈希函数的特征:
哈希表固定长度为2**28大小,通过hash函数映射成每个单调均映射到一个在[0,2**28)范围内的一个索引值;
一开始还不好理解,将2**28认为是词汇表的大小,其实这是哈希函数映射的一个表;所有单词均会被映射到该范围中;
2**28还是太高了,所以一开始就认为是词汇表的大小;这里应该定义成更小才不会被误解;比如128,64等等
案例: