Jsoup示例

2 篇文章 0 订阅
public class httpclient {
 public static void main(String[] args) {
 String html="http://v.hao123.com/movie/index/lx-aq";
 System.out.println(html+".............");
 Document  doc=Jsoup.parse(html);
 System.out.println(doc+".....doc........");
   try {
   Document  doct=Jsoup.connect(html).get();
   System.out.println(doct+"......doct.......");
  String title= doct.title();
  System.out.println(title+"......title.......");
  Jsoup.connect(html).data("query", "java")//请求参数
 .userAgent("I ’ m jsoup")//设置
 .cookie("auth", "token")//
  .timeout(3000)//设置连接超时时间
 .post(); //使用post方法访问url
  // 得到:<meta name="Keywords" content="电影频道,视频下载,体育视频,在线视频,免费视频,自拍,视频教学,网络视频"/>
  //Element  connect= doc.getElementById("content");
  Elements  address= doct.select("p.provide provider clearfix").select("a[href]");
  for (Element element : address) {
  String href=element.attr("href");
  String text=element.text();
  System.out.println("我是。。。。href的连接地址"+text+href);
 }
 /* 我想的是得到地址然后再下载会很麻烦的     写个下载功能 逐个下载到本地。。麻烦
 *  有人提议用httpclient 来抓取网页和图片
 * 这个问题暂时保留????????
 */
  Elements pic= doct.select("span.image").select("img[src]");// 所有引用 png 图片的元素
 for (Element element : pic) {
  String src=element.attr("src");
 String text= element.text();
 System.out.println("我是得到图片的地址。。。。"+text+src);
 }
 //  doc.select("div.pic").select("img[src$=.jpg]");// 所有引用 png 图片的元素
 Elements moviename=doct.select("div.itemlist").select("a.title");//得到电影名字
 //System.out.println("moviename。。。。。。。。。。。"+moviename);
  for (Element element : moviename) {
  String text=element.text();
  System.out.println("我是电影名。。。。"+text);
 }
  //  得到演员列表   有点复杂   先放着。。。。。。。。。。。
 
  Elements actor= doct.select("a.actorName");
  for (Element element : actor) {
 String text= element.text();
 System.out.println("演员。。。。。。。。。。。"+text);
 }
  System.out.println("..................");
  Elements area= doct.select("span.actorSplitToken").select("div.ext_info").select("span.ext_area");//地区
System.out.println("地区。area。。"+area);
 
 for (Element element : area) {
 String text=element.text();
 System.out.println("地区。。。"+text);
 }
  Elements time= doct.select("span.year"+" "+"clearfix");//时间
 
  for (Element element : time) {
 String text=element.text();
 System.out.println("时间。。。"+text);
 }
  Elements type= doct.select("p.twocol-wrapper clearfix").select("span.type clearfix");//类型
 //System.out.println("类型。。。"+type);
  for (Element element : area) {
 String text=element.text();
 System.out.println("类型。。。"+text);
 }
   
   
   } catch (IOException e) {
 // TODO Auto-generated catch block
 e.printStackTrace();
 }
 }
 } 


 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值