经过不断尝试和升级,抖音评论截流及短视频获取下载软件迎来最新版本。
一:概述
- 此次更新的版本解决了在抖音短视频上不能下载和下载后有水印的问题,也可以进行短视频批量下载。
- 此版本可以进行关键词的搜索找到自己想要的视频进行下载。
- 功能名称
3.1博主视频提取:通过博主的分享链接,进行视频的评论提取,支持实时监控
3.2单个视频提取:通过单个视频的分享链接,进行视频的评论提取,支持评论实时监控
- 查看评论详情,点击评论数据可查看评论详情,评论详情包括 1:评论人 2:评论日期 3:评论视频名称 4:视频作者5:视频播放地址 6:作者地址7:评论地址 8:评论内容9:评论人抖音二维码
二:解析内容源码
视频日期的标签和解析源码
因为视频时间 给的不是真正的日期 需要转换 这里进行了转换
string shipin_dates = "";
string htmlContent = html;
try
{
// string title = "";//获取title值 标题 视频名称
Regex regex = new Regex(@"<span class=""time"">(.*?)</span>", RegexOptions.IgnoreCase);
Match match = regex.Match(htmlContent);
if (match.Success)
{
// 获取匹配到的第一个组(即<title>和</title>之间的内容)
shipin_dates = match.Groups[1].Value.Trim();
//发布时间:
shipin_dates = shipin_dates.Replace("<span>", "");
shipin_dates = shipin_dates.Replace("/", "");
shipin_dates = shipin_dates.Replace("·", "");
shipin_dates = shipin_dates.Replace("日", "");
shipin_dates = shipin_dates.Replace("年", "-");
shipin_dates = shipin_dates.Replace("月", "-");
string day = "";
// try
// {
Regex yearRegex = new Regex(@"\b\d{4}\b");
Regex dateRegex = new Regex(@"\b\d{1,2}-\d{1,2}\b");
// 判断字符串中是否包含年份信息
if (yearRegex.IsMatch(shipin_dates.Trim()))
{
// Console.WriteLine("输入字符串包含年份信息");
}
else if (dateRegex.IsMatch(shipin_dates.Trim()))
{
// Console.WriteLine("输入字符串不包含年份信息,但包含日期信息");
shipin_dates = "2024-" + shipin_dates.Trim();
}
else
{
Console.WriteLine("输入字符串既没有年份信息,也不符合日期格式");
#region
//DateTime shipin_dates_y = Convert.ToDateTime(shipin_dates);
//if (shipin_dates_y.Year != 1)
//{
// shipin_dates = "2004-" + shipin_dates.Trim ();
// Console.WriteLine("这个日期变量包含年份。");
//}
//else
//{
// shipin_dates = "2004-" + shipin_dates.Trim ();
// //Console.WriteLine("这个日期变量不包含年份。");
//}
#endregion
// }
// catch
// {
char delimiter = '·';
int index1 = shipin_dates.IndexOf(delimiter);
if (index1 != -1)
{
string textBeforeDelimiter = shipin_dates.Substring(0, index1);
shipin_dates = textBeforeDelimiter;
Console.WriteLine("Text before delimiter: " + textBeforeDelimiter);
}
if (shipin_dates.Contains("天"))
{
// pinglun_riqi_yuanshi = extraInfo;
int index = shipin_dates.IndexOf("天");
day = shipin_dates.Substring(0, index);
DateTime dt = DateTime.Now.Date.AddDays(-Convert.ToInt32(Convert.ToInt32(day)));
shipin_dates = dt.ToShortDateString();
}
if (shipin_dates.Contains("月"))
{
//pinglun_riqi_yuanshi = extraInfo;
int index = shipin_dates.IndexOf("月");
day = shipin_dates.Substring(0, index);
DateTime dt = DateTime.Now.Date.AddMonths(-Convert.ToInt32(Convert.ToInt32(day)));
shipin_dates = dt.ToShortDateString();
}
if (shipin_dates.Contains("小时"))
{
// pinglun_riqi_yuanshi = extraInfo;
int index = shipin_dates.IndexOf("小时");
day = shipin_dates.Substring(0, index);
DateTime dt = DateTime.Now.Date.AddHours(-Convert.ToInt32(Convert.ToInt32(day)));
shipin_dates = dt.ToString();
}
if (shipin_dates.Contains("分钟"))
{
//pinglun_riqi_yuanshi = extraInfo;
int index = shipin_dates.IndexOf("分钟");
day = shipin_dates.Substring(0, index);
DateTime dt = DateTime.Now.Date.AddMinutes(-Convert.ToInt32(Convert.ToInt32(day)));
shipin_dates = dt.ToString();
}
if (shipin_dates.Contains("周"))
{
// pinglun_riqi_yuanshi = extraInfo;
int index = shipin_dates.IndexOf("周");
day = shipin_dates.Substring(0, index);
int week = (Convert.ToInt32(day) * 7);
DateTime dt = DateTime.Now.Date.AddDays(-Convert.ToInt32(week));
shipin_dates = dt.ToShortDateString();
}
if (shipin_dates.Contains("年"))
{
// pinglun_riqi_yuanshi = extraInfo;
int index = shipin_dates.IndexOf("年");
day = shipin_dates.Substring(0, index);
DateTime dt = DateTime.Now.AddYears(-Convert.ToInt32(Convert.ToInt32(day)));
shipin_dates = dt.ToShortDateString();
}
//判断当前时间是否和视频时间 是否大于
DateTime a = DateTime.Now; // 当前时间
DateTime b = DateTime.ParseExact(shipin_dates, "yyyy-MM-dd", System.Globalization.CultureInfo.InvariantCulture);// 视频时间,假设为 2022-05-27
TimeSpan interval = a - b; // 计算时间间隔
if (Math.Abs(interval.TotalDays) <= 730) // 判断时间间隔是否小于等于两年//这个里面的值 通过字段获取
{
Console.WriteLine("视频时间和当前时间在两年内");
}
else
{
Console.WriteLine("视频时间和当前时间不在两年内");
}
}
}
}
catch
{
//MessageBox.Show("608");
}
return shipin_dates;
三:功能介绍
1:博主视频、单个视频监控和获取
1.1输入此次任务的任务名称,
1.2复制粘贴博主分享链接或是单个视频分享链接(注:是分享链接而不是分享口令)
1.3输入评论监控词,监控词可以是一个或多个(注:当输入多个监控词时,每个监控词之间要用英文输入法的逗号隔开)最后保存任务开始抓取数据
1.4任务列表,显示的是实时抓取到的数据有任务名称,搜索词,视频数量,评论数量,命中数量;
1.5未命中评论:未命中报表是指搜索的视频中评论不包含命中词的评论。
内容包括:评论人,评论视频名称,视频作者,评论地区,评论内容,评论时间,批次号
已命中评论:已命中报表的解释:评论中包含,任务中设置的有效命中词在此列表显示
内容包括:评论人,评论视频名称,视频作者,评论地区,评论内容,评论时间,命中词,批次号
2:点击列表中的评论,会显示评论详情窗口可以查看评论的详细内容,内容包括:评论人,评论日期,评论视频,视频作者,视频地址,作者地址,评论人地址,评论内容,评论人二维码
四:实时监控
实时监控只针对博主视频和单个视频
建立一个新任务,输入博主分享链接后,系统会先将博主的视频解析,然后逐一解析视频的评论,解析完成后,自动进入监控,一但视频有新的评论就会被列出。