题意理解
给定一个字符串,已知字符串中出现nc种字符,现在求长度n的不同子串数量。字符串长度最大1600000。
问题分析
用hash数据结构
上手题
题目特征:字符串超长,字符串字符种类已知。
hash数据结构用法,将字符映射为数字,将子串映射为大的数。用数组记录映射情况,数组长度为1600000,用数组下标对应子串表示的大整数,用数组值true,false表示是否映射成功,这样避免重复统计。因为字符种类已知,那么字符映射为数字的情况有限。这里同样的,数组的下标表示字符对应的ascii码,数组的值对应一个整数(不超过字符总种类数)。剩下的工作,每找到一个子串就转化为整数,每转化一次,记录一次,转化次数就是子串数量。
其他
hash从没用过,第一次观摩,震撼。好东西,特别是大数据量情况。
代码链接
https://github.com/xierensong/learngit/blob/master/poj/p1200.cpp