java解析网页_java进行网页解析得到视频

最新推荐文章于 2024-05-20 10:33:01 发布

苏白衣

最新推荐文章于 2024-05-20 10:33:01 发布

阅读量910

点赞数

文章标签： java解析网页

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29774037/article/details/114055666

版权

本文介绍了如何利用Jsoup库在Java中解析网页，以获取视频名称和视频地址。通过连接指定URL，抓取包含视频信息的元素，然后解析元素内容，最终将视频名称和地址封装到VideoBean对象并存入列表。文章还提醒不同网站的解析方法会有所不同，此方法适用于特定URL。

摘要由CSDN通过智能技术生成

1，准备工作：一个jsoup的jar，一个视频bean类：

jar包

bean类

2，封装解析方法：

public static List getData(String url,String itemurl) throws IOException{

//通过Jsoup包下的方法得到Document对象

Document document=Jsoup.connect(url).get();

//用document对象去获得网页内容

/**

* 多个用Elements对象接收，一个用Element接收。

* 在html中(id得到只有一个，class得到的有多个,Tag得到的也是多个)

*

*

*/

//通过class名得到Elements对象infolist

Elements infoList=document.getElementsByClass("infoList");

//通过infilist的第0个对象得到标签为li的Element对象lis

Elements lis=infoList.get(0).getElementsByTag("li");

List data=new ArrayList();

//遍历lis

for (Element li:lis) {

//得到具体的内容是个a标签

Element content=li.getElementsByClass("tit").get(0).getElementsByTag("a").get(0);

//得到名称

String name=content.text();

System.out.println("视频名称："+name);

String href=content.attr("href");

System.out.println("a标签的链接："+href);

/**

* 通过href链接得到视频地址

*/

Document documentitem=Jsoup.connect(itemurl+href).get();

//视频地址在embed这个标签下，所以得到这个标签

Elements embed =documentitem.getElementsByTag("embed");

//开始获取视频地址，先拿到embed标签的flashvars属性返回值是String类型

String flashvars=embed.get(0).attr("flashvars");

System.out.println("flashvars属性："+flashvars);

//通过=将flashvar拆分成数组

String[] strs=flashvars.split("=");

//数组最后一项就是视频地址

String videourl=strs[strs.length-1];

System.out.println("视频地址："+videourl);

System.out.println("///");

data.add(new VideoBean(name,videourl));

}

return data;

}

3，方法调用打印结果：

方法调用

打印结果

4，最后：注意不同的网站有不同的解析方法，这个方法只能解析上面的url，url，我就不穿了，违规，如果想试试的朋友，私下找我。如果有不足之处请各位大神指教。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
java解析网页_java进行网页解析得到视频

1，准备工作：一个jsoup的jar，一个视频bean类：jar包bean类2，封装解析方法：public static List getData(String url,String itemurl) throws IOException{//通过Jsoup包下的方法得到Document对象Document document=Jsoup.connect(url).get();//用document...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。