java解析网页_java进行网页解析得到视频

本文介绍了如何利用Jsoup库在Java中解析网页,以获取视频名称和视频地址。通过连接指定URL,抓取包含视频信息的元素,然后解析元素内容,最终将视频名称和地址封装到VideoBean对象并存入列表。文章还提醒不同网站的解析方法会有所不同,此方法适用于特定URL。
摘要由CSDN通过智能技术生成

1,准备工作:一个jsoup的jar,一个视频bean类:

38a63373d83fb12d898f4e53329b6603.pngjar包

4996b26009b696f452de8ce1d1a9e210.pngbean类

2,封装解析方法:

public static List getData(String url,String itemurl) throws IOException{

//通过Jsoup包下的方法得到Document对象

Document document=Jsoup.connect(url).get();

//用document对象去获得网页内容

/**

* 多个用Elements对象接收,一个用Element接收。

* 在html中(id得到只有一个,class得到的有多个,Tag得到的也是多个)

*

*

*/

//通过class名得到Elements对象infolist

Elements infoList=document.getElementsByClass("infoList");

//通过infilist的第0个对象得到标签为li的Element对象lis

Elements lis=infoList.get(0).getElementsByTag("li");

List data=new ArrayList();

//遍历lis

for (Element li:lis) {

//得到具体的内容 是个a标签

Element content=li.getElementsByClass("tit").get(0).getElementsByTag("a").get(0);

//得到名称

String name=content.text();

System.out.println("视频名称:"+name);

String href=content.attr("href");

System.out.println("a标签的链接:"+href);

/**

* 通过href链接得到视频地址

*/

Document documentitem=Jsoup.connect(itemurl+href).get();

//视频地址在embed这个标签下,所以得到这个标签

Elements embed =documentitem.getElementsByTag("embed");

//开始获取视频地址,先拿到embed标签的flashvars属性 返回值是String类型

String flashvars=embed.get(0).attr("flashvars");

System.out.println("flashvars属性:"+flashvars);

//通过=将flashvar拆分成数组

String[] strs=flashvars.split("=");

//数组最后一项就是视频地址

String videourl=strs[strs.length-1];

System.out.println("视频地址:"+videourl);

System.out.println("///");

data.add(new VideoBean(name,videourl));

}

return data;

}

3,方法调用打印结果:

efd1d406380f26136e97e555330ae01a.png方法调用

35d6935ed7756e9c17cfe8de9e7c1ced.png打印结果

4,最后:注意不同的网站有不同的解析方法,这个方法只能解析上面的url,url,我就不穿了,违规,如果想试试的朋友,私下找我。如果有不足之处请各位大神指教。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值