昨天发现《女驯》 更新完了。今天起来了以后想了想,用Eclipse做了一个程序,把小说的内容从网络上面抓下来。一直从上午做到晚上7点。终于写完了。
主要用的就是java.net包下面的URL和URLConnection类,用DataInputStream进行数据的读取。其中遇到的几个问题:
1。好像是网站的要求,这读取图片的时候返回的都是固定的网站的宣传图片。我想了一想,应该是在前一个界面上面,服务器设置cookie,然后再正式访问的时候将cookie发送到服务器,这样服务器检测到以后再发送给客户端所请求的图片。
但是在Java中用URL重新生成以后对象以后,默认是没有之前的cookie内容的,所以得不到指定的图片。最后用代码
URL = new URL(path);
String cookie = URL.getConnection.getHeaderField("Set-Cookie");
在实际申请的时候,
URL = new URL(path); URL.getConnection.setHeaderField("Cookie",cookie);
这样就解决了问题。
真的挺佩服这个网站的编写者。
2。在读取图片的时候,我直接用InputStream对象读取得到的数据,然后将图片数据储存到指定的图片中去。但是不知道为什么好像总是会漏几个字符。所以总是不能显示出来制定的图片。
到最后,我看到别人用的是DataInputStream用来读取。不知道为什么?应该看看InputStream和DataInputStream有什么区别
今天王跃去洛阳了,呵呵。这个土鳖。还给我发短信了。一会被单词。