有个题目,就是给你100W个字典顺序的单词,让输出所有字母组成相同的单词,比如post,stop,pots。
hash映射 视为26进制数
每个计算hash值 然后找出其它种组合的哈希值
看是否存在
剪枝的策略 是如过进行到后边,不查询前边的
例如stop 那么不查询post或者pots 因为p<s
这样是O(N)?
一般的方法好像是《编程珠玑》上的wordprint:http://blog.csdn.net/ohmygirl/article/details/7936994
析:仔细研读本题,我们发现,所谓兄弟单词就是有相同的字母组成还是有不同的顺序的单词。因此我们可以对所有的单词做排序(根据字母表中的顺序对其排序),排序后的结果作为单词的唯一“签名”或者“标志”,例如单词army和单词mary的唯一签名就是“amry”.
如果本题目作为c/c++面试题。那么所用的数据结构可以是“hash_map + 单链表”(也可以是hash_map + 二维数组,有些浪费空间,或者是hash_map + list,容器套容器),具体的流程是:对于输入的单词列表,先计算单词的key(排序后的结果)如果key不再hash_map中,那么就将该单词加入hash_map中。hash——map的key就是单词的key,value是链表(或数组)。如果已经存在该key,那么单词加入value对应的单链表中。查询一个单词的所有兄弟单词的时候就可以简单滴查询hash_map,然后扫描相应的单链表即可。