.NET网络编程学习(三)--网络蜘蛛程序(Spider)

.NET网络编程学习(三)

在上一节中,我们通过一个简单的Http服务器程序学习了Socket服务器端的编程.
这一节将通过一个简单的网络蜘蛛程序(Spider)来学习Socket客户端的程序设计.

Spider是搜索引擎重要的组成部分,其基本的原理也比较简单,但要真正写一个能够用于搜索引擎的Spider绝非一件易事。

从本质来说,Spider就是一个网页下载程序,然后再对下载的网页进行分析,提取,整理,然后交给索引程序处理生成索引。

而对于Socket客户端来说,分以下几步来实现连接服务器端:

(1)创建IPEndPoint实例和套接字
 IPAddress hostIp = Dns.GetHostEntry("http://www.hust.edu.cn").addresslist[0];
 IPEndPoint ep = new IPEndPoint(hostIp, 80);
 Socket client = new Socket(AddressFamily.InterNetwork, SocketType.Stream, ProtocolType.Tcp);
(2)连接服务器端
   try
        {
            client.Connect(ep);
        }
        catch (SocketException e)
        {
            Console.WriteLine(e.Message);
        }
(3)发送请求
    client.Send(Encoding.GetEncoding("us-ascii").GetBytes("GET /index.html HTTP/1.1\r\n"));
    client.Send(Encoding.GetEncoding("us-ascii").GetBytes("Host:hust.edu.cn\r\n"));
    client.Send(Encoding.GetEncoding("us-ascii").GetBytes("Connection:Close\r\n"));
    client.Send(Encoding.GetEncoding("us-ascii").GetBytes("\r\n"));
(4)接收数据
 StringBuilder recstr = new StringBuilder();
        byte[] buff = new byte[1024];
        int rCount=0;
        while(true)
        {
            rCount = client.Receive(buff, buff.Length, SocketFlags.None); //读取数据
            if (rCount > 0)
            {
                recstr.Append(ASCIIEncoding.ASCII.GetString(buff, 0, rCount));
            }
            else
                break;
        }

完整代码如下:

using System;
using System.Collections.Generic;
using System.Text;
using System.Net;
using System.Net.Sockets;
using System.IO;
namespace MyHttpClient
{
    class Program
    {
        static void Main(string[] args)
        {
            IPAddress hostIp = Dns.GetHostEntry("www.hust.edu.cn").AddressList[0];
            IPEndPoint ep = new IPEndPoint(hostIp, 80);
            Socket client = new Socket(AddressFamily.InterNetwork, SocketType.Stream, ProtocolType.Tcp);
            try
            {
                client.Connect(ep);
            }
            catch (SocketException e)
            {
                Console.WriteLine(e.Message);
            }
            //发送请求
            client.Send(Encoding.GetEncoding("us-ascii").GetBytes("GET /index.html HTTP/1.1\r\n"));
            client.Send(Encoding.GetEncoding("us-ascii").GetBytes("Host:hust.edu.cn\r\n"));
            client.Send(Encoding.GetEncoding("us-ascii").GetBytes("Connection:Close\r\n"));
            client.Send(Encoding.GetEncoding("us-ascii").GetBytes("\r\n"));
            StringBuilder recstr = new StringBuilder();
            byte[] buff = new byte[1024];
            int rCount=0;
            while(true)
            {
                rCount = client.Receive(buff, buff.Length, SocketFlags.None); //读取数据
                if (rCount > 0)
                {
                    recstr.Append(ASCIIEncoding.ASCII.GetString(buff, 0, rCount));
                }
                else
                    break;
            }
            using (StreamWriter sw = new StreamWriter(File.Create(@"c:\test.html")))
            {
                sw.Write(recstr.ToString()); //写入文件
            }

            Console.WriteLine("下载成功!");
            Console.Read();
        }
    }
}```

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

是刘彦宏吖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值