应用程序
文章平均质量分 80
yuqingjiankong
这个作者很懒,什么都没留下…
展开
-
1.5抓取网页
1.5抓取网页现在我们把所有的都放在一起,尝试着做一次网页的抓取,大概的思路已经十分清楚了,首先建立连接,然后下载网页的内容,最后将网页内容存储到本地硬盘中。import java.io.BufferedInputStream;import java.io.DataOutputStream;import java.io.File;import java.io.FileOutpu原创 2014-07-17 10:50:10 · 474 阅读 · 0 评论 -
网络舆情系统的开发
第一章 爬取网页这一章主要介绍如何爬取网页,在实际应用中,通常采用网络爬虫来快速抓取大量网页,存入本地硬盘内,开源的爬虫软件有很多,在开源中国中有详细的介绍,http://www.oschina.net/project/tag/64/spider。在这一版本的舆情监控系统中,暂时不采用这样庞大的爬虫,因为我们需要的信息量并不大,通过自己写的爬虫程序便可以抓取足够的网页信息,在这一章,我们将抓取原创 2014-07-17 10:30:45 · 5260 阅读 · 1 评论 -
1.2StateCode
1.2StateCode 成功(2字头) 这一类型的状态码,代表请求已成功被服务器接收、理解、并接受。200 OK请求已成功,请求所希望的响应头或数据体将随此响应返回。201 Created请求已经被实现,而且有一个新的资源已经依据请求的需要而建立,且其 URI 已经随Location 头信息返回。假如需要的资源无法及时建立的话,应当返回 '202 Accept转载 2014-07-17 10:48:02 · 698 阅读 · 0 评论