抖音视频解析源码(无需cookie)最新版 2024/8/18

API,仅供学习交流使用,禁止用于商业用途、违法用途等,否则后果自负

前言

闲来无事,研究了一下抖音的视频接口,都需要cookie、msToken、a_bogus....这些参数才能调用获取解析,而且a_bogus算法且复杂,cookie也要时长更新,而我这个能跳过这些参数,直接能解析视频信息出来,无需cookie、a_bogus,且解析的视频一直都不会失效

原理 

 当我们请求手机端的抖音链接的时候,在F12获取源代码能得到一些视频信息json数据,所以只需要正则取到源代码下面的json数据就行了,请求头只需要添加User-Agent、Referer即可,无需cookie

模拟请求,得到了需要的数据,再使用正则取出转成json数据再取出值就好了

注意

 https://www.douyin.com/aweme/v1/play/?video_id=v0200fg10000cqd77sfog65gatpq9nm0   (复制再访问,在这访问会有重定向错误)

​该链接是抖音无水印播放接口,且每次访问都会跳转到新的地址,按道理视频一直都不会失效  video_id 参数在页面能搜索到

demo  

现在只支持解析图集跟视频,后续会添加实况视频解析

视频: https://api.yujn.cn/api/dy_jx.php?msg=https://v.douyin.com/irC9f9js/

图集: https://api.yujn.cn/api/dy_jx.php?msg=https://v.douyin.com/irC98HWU/ 

 贴上脚本

php 

<?php
$msg = urldecode($_REQUEST['msg']);      //获取视频链接

if (is_numeric($msg)) {
    $video_id = $msg;
} else {
    preg_match('/https?:\/\/[^\s]+/', $msg, $video_url);
    $video_url = $video_url[0];

    $redirected_url = get_redirected_url($video_url);
    preg_match('/(\d+)/', $redirected_url, $matches);
    $video_id = $matches[1];
    // echo $video_id;
}

function get_redirected_url($url) {
    $ch = curl_init($url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
    curl_exec($ch);
    $redirected_url = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL);
    curl_close($ch);
    return $redirected_url;
}



$headers = [
    'User-Agent: Mozilla/5.0 (Linux; Android 8.0.0; SM-G955U Build/R16NW) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Mobile Safari/537.36',
    'Referer: https://www.douyin.com/?is_from_mobile_home=1&recommend=1'
];


$url = "https://www.iesdouyin.com/share/video/$video_id/";

$ch = curl_init($url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);

$response = curl_exec($ch);
curl_close($ch);


preg_match('/_ROUTER_DATA\s*=\s*(\{.*?\});/', $response, $matches);
$data = $matches[1];

// 解析 JSON 数据
$jsonData = json_decode($data, true);

// 获取视频信息
$itemList = $jsonData['loaderData']['video_(id)/page']['videoInfoRes']['item_list'][0];
$nickname = $itemList['author']['nickname'];
$title = $itemList['desc'];
$awemeId = $itemList['aweme_id'];
$video = $itemList['video']['play_addr']['uri'];
$videoUrl = $video !== null ? (strpos($video, 'mp3') === false ? 'https://www.douyin.com/aweme/v1/play/?video_id=' . $video : $video) : null;
$cover = $itemList['video']['cover']['url_list'][0];
$images = $itemList['images'] ?? null;

$output = [
    'msg' =>empty($nickname)?'解析失败!💦':'解析成功!💬️',
    'name' => $nickname,
    'title' => $title,
    // 'aweme_id' => $awemeId,
    'video' => $videoUrl,
    'cover' => $cover,
    'images' => array_map(function($image) {
        return $image['url_list'][0];
    }, is_array($images) ? $images : []),
    'type' =>empty($images)?'视频':'图集',
    'tips' => '遇见API api.yujn.cn'  
];

header('Content-Type: application/json');
echo json_encode($output,JSON_UNESCAPED_UNICODE | JSON_PRETTY_PRINT | JSON_UNESCAPED_SLASHES);

?>

python

#遇见API api.yujn.cn
import requests
import re
import json

headers ={
    'user-agent':'Mozilla/5.0 (Linux; Android 8.0.0; SM-G955U Build/R16NW) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Mobile Safari/537.36',
    'referer':'https://www.douyin.com/?is_from_mobile_home=1&recommend=1'

}

url ='https://www.iesdouyin.com/share/video/7358413207083486505/'
res =requests.get(url,headers=headers).text
data =re.findall(r'_ROUTER_DATA\s*=\s*(\{.*?\});', res)[0]
json_data =json.loads(data)
# print(data)
item_list =json_data['loaderData']['video_(id)/page']['videoInfoRes']['item_list'][0]
nickname =item_list['author']['nickname']
title =item_list['desc']
aweme_id =item_list['aweme_id']
video =item_list['video']['play_addr']['uri']
video = 'https://www.douyin.com/aweme/v1/play/?video_id=' + video if 'mp3' not in video else  video
cover =item_list['video']['cover']['url_list'][0]
img =item_list['images']
print(title)
print(aweme_id)
print(video)
print(cover)
for image in img:
    images = image['url_list'][0]
    print(images)

#遇见API api.yujn.cn

后续会添加更多东西。。。。

### 使用Python实现音视频解析 #### 准备工作 为了使用Python解析并处理音视频,需先安装必要的库。通常涉及网络请求和HTML解析的库如`requests`和`BeautifulSoup`,以及用于处理JSON响应的数据结构操作工具。这些准备步骤确保了后续可以顺利获取到目标网页的内容[^1]。 ```bash pip install requests beautifulsoup4 lxml ``` #### 获取视频信息 通过分析分享页面或API接口返回的信息,可提取出视频的关键属性,比如ID、作者名、描述文字等。下面是一个简单的例子展示怎样发送HTTP GET请求至特定URL,并从中抽取所需数据: ```python import requests from bs4 import BeautifulSoup def fetch_video_info(video_url): headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)", "Accept-Language": "en-US,en;q=0.9" } response = requests.get(video_url, headers=headers) soup = BeautifulSoup(response.text, 'lxml') # 假设我们已经知道如何定位到包含视频详情的部分 video_details = {} try: title_tag = soup.find('meta', property="og:title")['content'] description_tag = soup.find('meta', property='og:description')['content'] video_details["title"] = title_tag.strip() video_details["description"] = description_tag.strip() except Exception as e: print(f"Error occurred while fetching info: {e}") return video_details ``` 这段代码展示了基本框架,实际应用时可能需要更复杂的逻辑来适应不同版本网站布局的变化或者应对反爬机制[^2]。 #### 下载无水印视频 当掌握了视频的具体地址之后,就可以进一步尝试去除默认附带的品牌标志或其他形式的标记。这里给出了一种简化版的方法,它依赖于第三方服务或是逆向工程得到的有效下载链接模式[^3]: ```python import os def download_douyin_video(url, output_folder='./videos'): if not os.path.exists(output_folder): os.makedirs(output_folder) filename = os.path.join(output_folder, f"{os.urandom(8).hex()}.mp4") with open(filename, 'wb') as file: resp = requests.get(url, stream=True) total_length = int(resp.headers.get('content-length')) if total_length is None: # no content length header file.write(resp.content) else: dl = 0 for data in resp.iter_content(chunk_size=4096): dl += len(data) file.write(data) return filename ``` 此函数接收一个指向目标文件的实际位置字符串参数url,并将其保存在当地指定目录下;注意这里的路径管理和错误处理部分可以根据具体需求调整优化。
评论 27
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值