使用Dify构建文生视频工作流：从提示词到视频生成的完整指南

Firefire✓

已于 2025-05-27 08:48:44 修改

阅读量1.1k

点赞数 22

文章标签：音视频 python fastapi 视频

于 2025-05-26 09:41:11 首次发布

本文链接：https://blog.csdn.net/weixin_50965958/article/details/148219121

版权

往期：
Docker入门
 将Python Flask服务打包成Docker镜像并运行的完整指南
 使用Dify构建智能文档生成工作流：Word与PPT自动化指南

文章目录

一、工作流概述
二、环境准备
- 1. 安装必要依赖
- 2. 配置文件设置
三、FastAPI服务实现
- 1. 核心API代码
- 2. 关键功能和视频生成流程：
四、Dify工作流构建
五、高级配置与优化
六、总结

本文详细介绍如何使用Dify平台构建一个完整的文生视频工作流，整合FastAPI服务、阿里云OSS存储和视频生成API。

一、工作流概述

我们的文生视频工作流将实现以下功能：

1、接收用户输入的文本提示词
2、调用视频生成API创建视频
3、将生成的视频保存到阿里云OSS
4、返回可访问的视频URL
如图所示：
在这里插入图片描述

二、环境准备

1. 安装必要依赖

首先确保你的Python环境(建议3.8+)已安装以下包：
pip install -r requirements.txt

requirements.txt的内容如下：
uvicorn==0.34.0
fastapi==0.115.6
oss2==2.18.0
pydantic==2.8.2
requests==2.31.0
openai==1.12.0

2. 配置文件设置

创建config.ini文件，包含以下关键配置：

[DEFAULT]
image_generation_url=https://jimeng.duckcloud.fun/v1/images/generations
audio_generation_url=http://111.119.215.74:8084/generate-audio/

[common]
video_output_path = /path/to/video/output
region = oss-cn-hangzhou
secret_id = your_secret_id
secret_key = your_secret_key
bucket = your_bucket_name
endpoint = https://oss-cn-beijing.aliyuncs.com

[auth]
valid_tokens = ["your_valid_token1", "your_valid_token2"]

[video_api]
cookie = your_cookie_string
sign = your_sign_string

web端逆向方式，通过 api 接口的方式实现，其中获取cookie和sign的方法请看大佬的博客，本文根据大佬的五步流改编。
https://blog.csdn.net/wwwzhouhui/article/details/146924091

三、FastAPI服务实现

1. 核心API代码

jimeng_video_service.py实现了视频生成的核心逻辑：

from fastapi import FastAPI, HTTPException, Depends, Header
from pydantic import BaseModel
import logging
import time
import requests
import uuid
import configparser
import json
import os
import datetime
import random
import oss2

# 设置日志
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

app = FastAPI()

# 读取配置文件
config = configparser.RawConfigParser()
# windows 路径
config.read('config.ini', encoding='utf-8')
# linux 路径
# config.read('config.ini', encoding='utf-8')
# 在读取 video_output_path 后添加目录检查和创建逻辑
video_output_path = config.get('common', 'video_output_path')
if not os.path.exists(video_output_path):
    os.makedirs(video_output_path)
    logger.info(f"创建视频输出目录: {video_output_path}")


class VideoRequest(BaseModel):
    prompt: str
    aspect_ratio: str = "16:9"
    duration_ms: int = 5000
    fps: int = 24


def verify_auth_token(authorization: str = Header(None)):
    """验证 Authorization Header 中的 Bearer Token"""
    if not authorization:
        raise HTTPException(status_code=401, detail="Missing Authorization Header")

    scheme, _, token = authorization.partition(" ")
    if scheme.lower() != "bearer":
        raise HTTPException(status_code=401, detail="Invalid Authorization Scheme")

    # 从配置文件读取有效token列表
    valid_tokens = json.loads(config.get('auth', 'valid_tokens'))
    if token not in valid_tokens:
        raise HTTPException(status_code=403, detail="Invalid or Expired Token")

    return token


def generate_timestamp_filename_for_video(extension='mp4'):
    timestamp = datetime.datetime.now().strftime("%Y%m%d%H%M%S")
    random_number = random.randint(1000, 9999)
    filename = f"video_{timestamp}_{random_number}.{extension}"
    return filename


def download_video(url, output_path):
    response = requests.get(url, stream=True)
    response.raise_for_status()

    filename = generate_timestamp_filename_for_video()
    file_path = os.path.join(output_path, filename)

    with open(file_path, 'wb') as file:
        for chunk in response.iter_content(chunk_size=8192):
            if chunk:
                file.write(chunk)

    return filename, file_path


def upload_to_oss(file_path, object_name=None):
    """上传文件到阿里云OSS"""
    auth = oss2.Auth(config.get('common', 'secret_id'),
                     config.get('common', 'secret_key'))
    bucket = oss2.Bucket(auth,
                         config.get('common', 'endpoint'),
                         config.get('common', 'bucket'))

    if not object_name:
        object_name = os.path.basename(file_path)

    try:
        bucket.put_object_from_file(object_name, file_path)
        url = f"https://{config.get('common', 'bucket')}.{config.get('common', 'endpoint').replace('https://', '')}/{object_name}"
        return url
    except Exception as e:
        logger.error(f"上传到OSS失败: {str(e)}")
        raise


@app.post("/jimeng/generate_video/")
async def generate_video(request: VideoRequest, auth_token: str = Depends(verify_auth_token)):
    try:
        logger.info(f"generate_video API 调用开始，提示词: {request.prompt}")
        start_time = time.time()

        # 从配置文件中获取视频API相关配置
        video_api_cookie = config.get('video_api', 'cookie')
        video_api_sign = config.get('video_api', 'sign')

        # 初始化视频生成API相关配置
        video_api_headers = {
            'accept': 'application/json, text/plain, */*',
            'accept-language': 'zh-CN,zh;q=0.9',
            'app-sdk-version': '48.0.0',
            'appid': '513695',
            'appvr': '5.8.0',
            'content-type': 'application/json',
            'cookie': video_api_cookie,
            'device-time': str(int(time.time())),
            'lan': 'zh-Hans',
            'loc': 'cn',
            'origin': 'https://jimeng.jianying.com',
            'pf': '7',
            'priority': 'u=1, i',
            'referer': 'https://jimeng.jianying.com/ai-tool/video/generate',
            'sec-ch-ua': '"Google Chrome";v="129", "Not=A?Brand";v="8", "Chromium";v="129"',
            'sec-ch-ua-mobile': '?0',
            'sec-ch-ua-platform': '"Windows"',
            'sec-fetch-dest': 'empty',
            'sec-fetch-mode': 'cors',
            'sec-fetch-site': 'same-origin',
            'sign': video_api_sign,
            'sign-ver': '1',
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36'
        }
        video_api_base = "https://jimeng.jianying.com/mweb/v1"

        # 生成唯一的submit_id
        submit_id = str(uuid.uuid4())

        # 准备请求数据
        generate_video_payload = {
            "submit_id": submit_id,
            "task_extra": "{\"promptSource\":\"custom\",\"originSubmitId\":\"0340110f-5a94-42a9-b737-f4518f90361f\",\"isDefaultSeed\":1,\"originTemplateId\":\"\",\"imageNameMapping\":{},\"isUseAiGenPrompt\":false,\"batchNumber\":1}",
            "http_common_info": {"aid": 513695},
            "input": {
                "video_aspect_ratio": request.aspect_ratio,
                "seed": 2934141961,
                "video_gen_inputs": [
                    {
                        "prompt": request.prompt,
                        "fps": request.fps,
                        "duration_ms": request.duration_ms,
                        "video_mode": 2,
                        "template_id": ""
                    }
                ],
                "priority": 0,
                "model_req_key": "dreamina_ic_generate_video_model_vgfm_lite"
            },
            "mode": "workbench",
            "history_option": {},
            "commerce_info": {
                "resource_id": "generate_video",
                "resource_id_type": "str",
                "resource_sub_type": "aigc",
                "benefit_type": "basic_video_operation_vgfm_lite"
            },
            "client_trace_data": {}
        }

        # 发送生成视频请求
        generate_video_url = f"{video_api_base}/generate_video?aid=513695"
        logger.info(f"发送视频生成请求...")

        response = requests.post(generate_video_url, headers=video_api_headers, json=generate_video_payload)
        if response.status_code != 200:
            raise HTTPException(status_code=500, detail=f"视频生成请求失败，状态码：{response.status_code}")

        response_data = response.json()
        if not response_data or "data" not in response_data or "aigc_data" not in response_data["data"]:
            raise HTTPException(status_code=500, detail="视频生成接口返回格式错误")

        task_id = response_data["data"]["aigc_data"]["task"]["task_id"]
        logger.info(f"视频生成任务已创建，任务ID: {task_id}")

        # 轮询检查视频生成状态
        mget_generate_task_url = f"{video_api_base}/mget_generate_task?aid=513695"
        mget_generate_task_payload = {"task_id_list": [task_id]}

        # 最多尝试30次，每次间隔2秒
        for attempt in range(30):
            time.sleep(2)
            logger.info(f"检查视频状态，第 {attempt + 1} 次尝试...")

            response = requests.post(mget_generate_task_url, headers=video_api_headers, json=mget_generate_task_payload)
            if response.status_code != 200:
                logger.warning(f"状态检查失败，状态码：{response.status_code}")
                continue

            response_data = response.json()
            if not response_data or "data" not in response_data or "task_map" not in response_data["data"]:
                logger.warning("状态检查返回格式错误")
                continue

            task_data = response_data["data"]["task_map"].get(task_id)
            if not task_data:
                logger.warning(f"未找到任务 {task_id} 的状态信息")
                continue

            task_status = task_data.get("status")
            logger.info(f"任务状态: {task_status}")

            if task_status == 50:  # 视频生成完成
                if "item_list" in task_data and task_data["item_list"] and "video" in task_data["item_list"][0]:
                    video_data = task_data["item_list"][0]["video"]
                    if "transcoded_video" in video_data and "origin" in video_data["transcoded_video"]:
                        video_url = video_data["transcoded_video"]["origin"]["video_url"]
                        elapsed_time = time.time() - start_time
                        logger.info(f"视频生成成功，耗时 {elapsed_time:.2f} 秒，URL: {video_url}")

                        # 下载视频到本地并上传到阿里云OSS
                        try:
                            filename, file_path = download_video(video_url, video_output_path)
                            logger.info(f"视频已下载到本地: {file_path}")

                            # 上传到阿里云OSS
                            oss_url = upload_to_oss(file_path)
                            logger.info(f"视频已上传到OSS: {oss_url}")

                            return {"video_url": oss_url, "task_id": task_id}
                        except Exception as e:
                            logger.error(f"处理视频文件失败: {str(e)}")
                            raise HTTPException(status_code=500, detail=f"处理视频文件失败: {str(e)}")

                raise HTTPException(status_code=500, detail="视频生成完成但未找到下载地址")

        raise HTTPException(status_code=500, detail="视频生成超时")

    except Exception as e:
        logger.error(f"视频生成失败: {str(e)}")
        raise HTTPException(status_code=500, detail=str(e))


if __name__ == "__main__":
    import uvicorn

    uvicorn.run(app, host="0.0.0.0", port=8088)

2. 关键功能和视频生成流程：

1、接收用户提示词和参数

2、调用视频生成API

3、轮询检查生成状态

4、下载生成的视频

5、上传到阿里云OSS

6、返回OSS视频URL

四、Dify工作流构建

1. 创建新应用

1、登录Dify平台

2、点击"创建新应用"

3、选择"工作流"类型

4、命名为"文生视频工作流"

2. 设计工作流节点

1、开始输入
类型: 文本输入
配置:

变量名: prompt
描述: "请输入视频描述"

2、LLM模型提示词：
你是一个文生视频提示词专家,用户输入一段简短提示词 {{#1735530465219.prompt#}}，通过该提示词扩写符合即梦AI文生视频的提示词。
可以参考下面的提示词。
举例：
一个小男孩在球场上踢足球。
改写后的提示词：
画面的中心位置，站着一个充满活力的小男孩。他身着一件鲜艳夺目的蓝色足球服，衣服上还印着闪闪发光的金色号码，显得格外帅气。下身搭配着一条洁白如雪的短裤，脚蹬一双黑色的足球鞋，整个人英姿飒爽。此刻，他正铆足了劲，奋力踢向脚下那颗黑白相间的足球。足球场上，翠绿的草坪宛如一块巨大的绿色绒毯，草坪的边缘有着清晰的白色边线，仿佛给这绿色的世界勾勒出了整齐的轮廓。球场的周围是一道绿色的围栏，围栏之外，是一排排整齐排列的蓝色观众座椅。抬头望去，天空湛蓝如宝石一般，几朵洁白似棉絮的云朵悠然地飘浮着。小男孩神情专注且兴奋，他那坚定的眼神紧紧地锁定着足球滚动的方向，整个画面都洋溢着蓬勃的活力与热烈的激情。
在这里插入图片描述

3、HTTP请求调用视频生成API

在这里插入图片描述

类型: HTTP请求
配置:

URL: http://your-server:8088/jimeng/generate_video/
方法: POST
Headers:
	Authorization: Bearer your_token
	Content-Type: application/json

Body:

{
  "prompt": "{{prompt}}",
  "aspect_ratio": "16:9",
  "duration_ms": 5000,
  "fps": 24
}

其中Authorization：Bearer的值是需要在dify中创建与python服务相对应的环境变量
在这里插入图片描述

4、代码节点（处理返回信息）

在这里插入图片描述

def main(arg1: str) -> dict:
    import json
    data = json.loads(arg1)
    video_url = data['video_url']
    filename = "生成视频"
    markdown_result = f"<video controls><source src='{video_url}' type='video/mp4'>{filename}</video>"
    return {
        "result": markdown_result,
        "video_url": video_url
    }