翔宇的blog.....

技术文摘,开发手记,翔宇……

原创 关于“抓网页”的几篇文章收藏

新一篇: 用FCKEditor 2.0b2 - JSP Integration Pack ver 1.0 b2中的servlet实现FCKeditor_2.0RC3的上传功能的大体步骤 | 旧一篇: java rss lib 评测

网上相关文章:JAVA/JSP学习系列之十一(简单的“抓网页”代码)                  

                   

从HTML中攫取你所需的信息

-------------------------------------------------------------------------------------------------------------------------

通过java.net.Socket类抓取网页内容

原文链接:http://blog.csdn.net/cqq/archive/2004/09/24/115664.aspx

**
 文件名 : FirstSocket.java
 描述 :通过 java.net.Socket 类访问一个Web页面,并且返回结果
 作者: 慈勤强  
cqq1978@yeah.net
 参考:http://java.sun.com
  **/

import java.io.*;
import java.net.*;

public class FirstSocket
{
 public static void main(String args[])
 {
  
  //判断参数是否为两个,正确的用法为 FirstSocket 网站 页面
  if(args.length!=2)
  {
   System.out.println("Usage : FirstSocket host page\r\nExample:FirstSocket
www.google.com /");
   System.exit(0);
  }
  String strServer=args[0]; //取得第一个参数
  String strPage = args[1]; //取得第二个参数

  try
  {
   String hostname = strServer;
   int port = 80;
   InetAddress addr = InetAddress.getByName(hostname);
   Socket socket = new Socket(addr, port); //建立一个Socket
   
   //发送命令
   BufferedWriter wr = new BufferedWriter(new OutputStreamWriter(socket.getOutputStream(), "UTF8"));
   wr.write("GET " + strPage + " HTTP/1.0\r\n");
   wr.write("HOST:" + strServer + "\r\n");
   wr.write("\r\n");
   wr.flush();
   
   //接收返回的结果
   BufferedReader rd = new BufferedReader(new InputStreamReader(socket.getInputStream()));
   String line;
   while ((line = rd.readLine()) != null) {
    System.out.println(line);
   }
   wr.close();
   rd.close();
  }
  catch (Exception e)
  {
   System.out.println(e.toString());
   }
 }
}

发表于 @ 2005年03月21日 22:45:00|评论(loading...)|编辑

新一篇: 用FCKEditor 2.0b2 - JSP Integration Pack ver 1.0 b2中的servlet实现FCKeditor_2.0RC3的上传功能的大体步骤 | 旧一篇: java rss lib 评测

评论:没有评论。

发表评论  


当前用户设置只有注册用户才能发表评论。如果你没有登录,请点击登录
Csdn Blog version 3.1a
Copyright © dacula