毕业论文
SunQiFu3
这个作者很懒,什么都没留下…
展开
-
致谢
感谢几年来传授我知识的老师们,更要感谢我的家人对我学业上的支持和鼓励,感谢所有关心帮助过我的人。原创 2022-07-01 08:26:37 · 337 阅读 · 1 评论 -
结论
而爬取58同城就为人们提供了很好的服务,为人们更加快捷方便的提供服务原创 2022-07-01 08:24:47 · 938 阅读 · 0 评论 -
第六章 系统测试
最终爬取效果原创 2022-07-01 08:18:41 · 96 阅读 · 0 评论 -
第五章 系统实行
首先,打开包含我们需要的信息的网页,如图所示,网页上的习题内容很多,如果想要凭肉眼找到我们需要的信息会很麻烦。原创 2022-07-01 08:12:16 · 73 阅读 · 0 评论 -
第4章 系统设计
爬虫广泛使用于搜索引擎、新闻聚合以及大数据采集当中,一个良好的爬虫系统需要考虑很多方面:爬虫种子的获取需要有个稳定的任务调度机制,下载页面过程需要考虑到网页内容的生成是否是需要js渲染,请求网页是否需要设置请求头,还有请求过多会不会被对方封锁。另外就是数据处理过程,什么页面需要进行数据提取,什么页面是分裂成其它页面,还有页面内容提取需要采用什么手段:比如css selector解析,xpath解析,还有许多内容是通过json格式返回 需要解析json,还有的内容是属于xml,这就需要你都还有当获取到结果之后原创 2022-06-23 10:40:06 · 75 阅读 · 0 评论 -
第2章 关键技术介绍
Python 是一种面向对象、解释型、弱类型的脚本语言,它也是一种功能强大而完善的通用型语言。原创 2022-06-15 10:15:35 · 174 阅读 · 0 评论 -
第1章 绪论
随着我国计算机互联网技术的飞速发展,,房屋交易系统系统的实施与建设,在技术与能力上已经日渐成熟。网上看房给人们生活带来了巨大的变化,除了购房场所的改变以外,更重要的是大大改变了传统的消费行为习惯,本课题就是研究提取新房的能力,这能极大的缩短时间,能准确的找到目标......原创 2022-06-10 10:48:14 · 955 阅读 · 0 评论