- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 大数据下的字典与排序
如果遇到类似这样的问题:存在一个文本文件,每行一段字符,求出其中重复度大于n的行并输出解决这个问题就需要一种匹配的方法,具体匹配,可以从字典或排序的角度去思考。字典方法:从前往后扫描数据同时建立字典记录命中次数,最终扫描字典输出命中数值>n的记录复杂度: O(N) 空间占用:O(N)实现:awk '{ dic[$0] ++;} END { f
2014-04-02 20:42:13 1158
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人