团队编程需求分析

1. 引言

1.1 目的:为网络数据爱好者更好的收集数据

1.2背景:软件系统名称:网络爬虫

1.3 定义 :网络爬虫 搜索引擎Web url信息互联网

1.4 参考资料  百度搜索

2.任务概述

2.1 目标

系统流程图

 

1) 客户端向服务器发送自己设定好的请求

2)通过通过httpWeb服务器上协议站点的网页代码提取出来

3)亘古一定的正则表达式提取出需要的信息

4)采用深度优先so8usuo从网页中某个链接出发,访问该连接的网页,并通过递归算    法实现一次向下访问

5)采用广度优先搜索从网页中某个链接出发,访问该链接网页上的所有连接,访问完

   成后,再通过递归算法实现下一层的访问

2.2 运行系统

支持所有系统

3.需求规定

3.1功能规定

从网站某一个页面开始,读取网页的内容,找到在网页中的其他链接地址,然后通过 这些链接地址寻找下一个网页。

 

3.2使用库

urllib

 

4.运行环境规定

4.1支持软件

本系统采用python制作 测试软件python2.7

 

4.2 数据流图

 

 

转载于:https://www.cnblogs.com/npqnpq/p/7490128.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值