团队编程需求分析

最新推荐文章于 2024-04-07 20:48:15 发布

weixin_30925411

最新推荐文章于 2024-04-07 20:48:15 发布

阅读量72

点赞数

文章标签： python 爬虫数据结构与算法

原文链接：http://www.cnblogs.com/npqnpq/p/7490128.html

版权

1. 引言

1.1 目的：为网络数据爱好者更好的收集数据

1.2背景：软件系统名称：网络爬虫

1.3 定义：网络爬虫搜索引擎Web url信息互联网

1.4 参考资料百度搜索

2.任务概述

2.1 目标

系统流程图

1）客户端向服务器发送自己设定好的请求

2）通过通过http将Web服务器上协议站点的网页代码提取出来

3）亘古一定的正则表达式提取出需要的信息

4）采用深度优先so8usuo从网页中某个链接出发，访问该连接的网页，并通过递归算法实现一次向下访问

5）采用广度优先搜索从网页中某个链接出发，访问该链接网页上的所有连接，访问完

成后，再通过递归算法实现下一层的访问

2.2 运行系统

支持所有系统

3.需求规定

3.1功能规定

从网站某一个页面开始，读取网页的内容，找到在网页中的其他链接地址，然后通过这些链接地址寻找下一个网页。

3.2使用库

urllib

4.运行环境规定

4.1支持软件

本系统采用python制作测试软件python2.7

4.2 数据流图

转载于:https://www.cnblogs.com/npqnpq/p/7490128.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。