java/网络爬虫
文章平均质量分 76
zbqyexingkong
这个作者很懒,什么都没留下…
展开
-
jsop中的select()的使用
今天,我写了一个爬取百度贴吧中的图片时,遇见了一个让我有点困惑的问题,就是在使用jsoup中的选择器时 在里边写明了要寻找的div 标签下的内容,比如: 发现在类中有一个空格(图中画箭头处),那前后这两个变量又是什么意思呢?其实在html中说过 class是设置标签的类,用于指定元素是属于何种样式的类,在css样式中,以小写“点”及“.”来命名。在html页原创 2013-08-06 17:48:02 · 1316 阅读 · 0 评论 -
httpclient/jsoup模拟登陆人人网
HttpClient(DefaultHttpClient)代表了一个会话,在同一个会话中,HttpClient对cookie自动进行管理(当然,也可以在程序中进行控制)。在同一个会话中,当使用post或是get发起一个新的请求时,一般需要对调用前一个会话的abort()方法,否则会抛出异常。有些网站登录成功后会重定向(302, 303),比如这里的人人网。如果发出的是post请求,需要从响应头中取原创 2013-09-12 18:01:18 · 2832 阅读 · 1 评论