在编写网络爬虫(spider)过程中遇到的各种难题(持续更新中)
最近在写一个网络爬虫,参考书籍为《网络机器人java编程指南》,一本7,8年前的老书了,不过对于我这种菜鸟来说其中仍然包含着大量的知识。我从2011年2月24日开始动手写自己的spider,基本参照书上的程序来写,当然会删除一些太难理解或者很少用到的类,并对部分地方做一些优化。下面将开始记录我在编写spider过程中遇到的各种难题与困难。--------------------------------2月24日java的IO流问题。IO流分为inputstream/outputstream与reader/w
原创
2011-02-25 15:08:00 ·
448 阅读 ·
0 评论