![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
网络爬虫
文章平均质量分 70
huo_chai_gun
生活就是一面镜子,你对它微笑,它也对你微笑......
展开
-
Redis自学笔记整理
Redis的简介 Redis是完全开源免费的,遵守BSD协议,先进的key -value持久化产品。它通常被称为数据结构服务器,因为值(value)可以是字符串(String), 哈希(Map),列表(list),集合(sets)和 有序集合(sorted sets)等类型。 redis的下载和安装 本地测试下载目录: cd / lamp:所有下载文件原创 2014-11-20 11:29:11 · 3988 阅读 · 0 评论 -
使用httpclient4.3.X模拟post请求登陆网站获取cookie信息的操作
众所周知,httpclient可以模拟登陆操作,下面我就来个实例测试一下,顺便也回忆下这个开源工具的使用,直接上例子吧! package com.pyc.search.crawler.node.login; import java.io.IOException; import java.util.concurrent.TimeUnit; import org.apach原创 2014-11-26 14:49:38 · 8502 阅读 · 1 评论 -
利用Jsoup解析器抓取网页源代码
抓取百度首页网页源代码的例子 package com.pyc.search.crawler.node.tools; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; public class TestJsoup { public static Document原创 2014-11-26 15:28:34 · 715 阅读 · 0 评论 -
利用httpclient开源工具抓取网页的源码,并且控制台打印出来工具类的编写
利用httpclient开源工具抓取网页的源码,并且控制台打印出来工具类的编写 package com.pyc.search.crawler.node.tools; import java.io.InputStream; import org.apache.http.HttpEntity; import org.apache.http.HttpResponse; import org原创 2014-11-26 14:56:27 · 661 阅读 · 0 评论 -
jsoup的简单介绍
本编文章摘自百度百科,目的是介绍Jsoup Jsoup概述编辑 jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 jsoup的主要功能如下: 1. 从一个URL,文件或字符串中解析HTML; 2. 使用DOM或CSS选择器来查找、取出数据;原创 2014-11-26 15:11:29 · 411 阅读 · 0 评论