- 博客(2)
- 收藏
- 关注
heritrix爬取动态网页
刚接手heritrix,试了一试,抓取文件很顺利,可是却发现了一个问题。 用heritrix抓取了jsp文件,可是抓取的文件名如下:show_hotelshopid=102&catid=2.jsp 可实际想要的url是show_hotel.jsp?shopid=102&catid=2 如何将文件名与url相关联起来? 要重写writer么?或是其他 由于windows file ...
2008-07-31 16:50:10 243
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人