在B站看课的进度助手

文章介绍了一个名为BilibiliVideoDurationCrawler的Java爬虫程序,用于从B站视频链接中提取视频的分P信息以及每个部分的观看进度。它利用Jsoup库抓取网页源代码,解析视频分段的标识和持续时间,计算观看进度并打印输出。
摘要由CSDN通过智能技术生成

效果

在这里插入图片描述

代码

BilibiliVideoDurationCrawler

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
import java.text.ParseException;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class BilibiliVideoDurationCrawler {
    private static final Pattern VIDEO_PART_PATTERN = Pattern.compile("\"part\":\"(.*?)\",\"duration\":(\\d+),");
    /**
     * 主函数:根据视频链接获取视频分P信息并打印每一集的观看进度
     * 参数:args - 传入的命令行参数数组
     */
    public static void main(String[] args) {
        

        // 根据视频链接获取视频分P信息的步骤
        String url = "https://www.bilibili.com/video/BV1834y1676P/";
        List<VideoPart> videoParts = new ArrayList<>();
        try {
            videoParts = getVideoPartsFromUrl(url); // 1. 获取网页源代码并爬取视频信息,转换为视频对象列表
        } catch (IOException | ParseException e) {
            System.err.println("获取视频信息失败:" + e.getMessage());
            return;
        }

        // 打印每一集所在进度的步骤
        if (!videoParts.isEmpty()) {
            for (int i = 0; i < videoParts.size(); i++) {
                String progress = getProgressStr(videoParts, i); // 获取指定集数的观看进度的字符串表示
                System.out.println("p" + (i + 1) + " " + videoParts.get(i).getPart() + " " + progress); // 打印集数、标题和进度
            }
        }
    }

    /**
     * 从给定的URL获取视频分段信息的列表。
     * @param url 需要解析的网页URL,预期包含视频分段的相关信息。
     * @return 返回一个包含视频分段及其持续时间的VideoPart对象列表。
     * @throws IOException 如果在连接或获取网页内容时发生IO异常。
     */
    public static List<VideoPart> getVideoPartsFromUrl(String url) throws IOException, ParseException {
        // 使用Jsoup连接指定URL并获取网页内容,模拟浏览器行为
        Document doc = Jsoup.connect(url).userAgent("Mozilla/5.0").get();

        // 选择网页中所有的<script>元素
        Elements elements = doc.select("script");

        // 用于临时存储匹配到的视频分段信息
        List<String> result = new ArrayList<>();

        // 遍历所有<script>元素,尝试匹配视频分段信息
        for (Element element : elements) {
            Matcher matcher = VIDEO_PART_PATTERN.matcher(element.html());
            while (matcher.find()) {
                // 将匹配到的分段信息以字符串形式添加到result列表中
                result.add("Part: " + matcher.group(1) + ", Duration: " + matcher.group(2));
            }
        }

        // 从result列表中解析出VideoPart对象并添加到videoParts列表中
        List<VideoPart> videoParts = new ArrayList<>();
        // 优化 totalDuration 的计算, 避免重复计算
        long totalDuration = 0;
        for (String str : result) {
            // 分割字符串以获取分段名称和持续时间
            String[] parts = str.split(", ");
            String part = parts[0].split(": ")[1];
            long duration = Long.parseLong(parts[1].split(": ")[1]);
            totalDuration += duration;
            // 创建VideoPart对象并添加到列表
            VideoPart videoPart = new VideoPart(part, duration);
            videoParts.add(videoPart);
        }
        VideoPart.setTotalDuration(totalDuration);
        return videoParts;
    }

    /**
     * 计算给定视频片段列表中前p个片段的进度百分比,并返回格式化后的字符串。
     *
     * @param videoParts 视频片段列表,每个片段包含持续时间。
     * @param p 计算进度时考虑的视频片段数量(从0开始)。
     * @return 返回计算出的进度百分比的字符串表示,保留两位小数。
     */
    public static String getProgressStr(List<VideoPart> videoParts, int p) {
        // 验证参数合法性
        if (videoParts == null || p < 0 || p >= videoParts.size()) {
            throw new IllegalArgumentException("Invalid video parts or index p");
        }

        // 计算所有视频片段的总长度
        long totalLength = VideoPart.getTotalDuration();

        // 计算前p个视频片段的长度总和
        long lengthBeforeP = 0;
        for (int i = 0; i <= p; i++) {
            lengthBeforeP += videoParts.get(i).getDuration();
        }

        // 根据前面计算的长度,计算并返回进度百分比,结果保留两位小数
        double progress = (double) lengthBeforeP / (totalLength == 0 ? 1 : totalLength) * 100;
        return String.format("%.2f%%", progress);
    }
}


VideoPart

import lombok.AllArgsConstructor;
import lombok.Data;

import java.util.Date;

@Data
@AllArgsConstructor
/**
 * 视频部分信息类,用于描述视频的一个片段。
 */
public class VideoPart {
    /**
     * 构造方法,初始化视频片段的信息。
     * @param part 视频片段的标识。
     * @param duration 视频片段的持续时间,单位为秒。
     */
    public VideoPart(String part,long duration){
        this.part = part;
        this.duration = duration;
    }

    public static void setTotalDuration(long totalDuration) {
        VideoPart.totalDuration = totalDuration;
    }

    public static long getTotalDuration() {
        return totalDuration;
    }

    /**
     * 将持续时间转换为需要的时间对象。
     * 该方法将持续时间(秒)转换为Date对象,假设每秒为1000毫秒。
     */
    public void Duration2NeedTime(){
        this.needTime = new Date(duration*1000);
    }
    private String part; // 视频片段标识
    private long duration; // 视频片段持续时间,单位为秒
    private Date needTime; // 视频片段需要的时间,Date对象表示
    private double progress; // 视频片段的进度

    private static long totalDuration =-1; // 所有视频片段的总持续时间,初始值为-1表示未计算
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值