- 博客(2)
- 资源 (8)
- 收藏
- 关注
原创 java爬虫学习日记1-基本爬虫原理介绍
通过URL抓取网页内容 上面讲了URL的构成,下面主要阐述根据URL抓取网页。所谓网页抓取就是把URL地址重指定的网络资源从网络流中读取出来,然后保存到本地。类似于使用程序模拟浏览器功能,把URL作为HTTP请求的内容发送到服务器,然后读取服务器的响应资源。
2016-04-26 23:08:30 552
原创 java爬虫学习日记2-宽度优先爬虫代码实现
上一日记中学到了抓取单个页面内容的方法,但实际项目中则需要爬虫遍历互联网,把互联网中相关的页面都抓取回来。那么爬虫是怎样遍历互联网,把页面抓取下来的呢?首先互联网可以开成是一个"图",每个页面可以看作一个节点,链接可以看作是"有向边"。因此能够通过图的方式对互联网这超级大"图"进行遍历。图的遍历通常可分为宽度优先遍历和深度优先遍历这两种方式。
2016-04-26 23:05:49 995
plsql完全绿色版
2016-04-28
instantclient11_2-windowx86-64.zip
2016-04-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人