- 博客(1)
- 收藏
- 关注
转载 Nutch url过滤规则
<br />nutch网上有不少有它的源码解析,但是采集这块还是不太让人容易理解.今天终于知道怎么,弄的.现在把crawl-urlfilter.txt文件贴出来,让大家一块交流,也给自己备忘录一个。<br /> <br /># Licensed to the Apache Software Foundation (ASF) under one or more<br /># contributor license agreements. See the NOTICE file distributed with
2010-06-03 16:02:00
476
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人