等风来不如迎风去
AI领域初学者,AI+实时语音,AI+2/3D动画生成;AI+UE表演,AI+游戏NPC;音视频行业深耕多年,熟悉会议、直播、RTC,对在线教育、娱乐秀场等音视频端到端技术及系统架构有深入研究
展开
-
【歌曲结构】2:小节与歌曲结构信息整合
小节与歌曲结构信息整合原创 2025-05-15 22:53:51 · 121 阅读 · 0 评论 -
【歌曲结构】1:基于歌词的歌曲结构分析:高潮、钩子、双副歌
这种"双副歌"结构是一种精心的音乐编排设计,有着特定的艺术和商业考量。原创 2025-05-15 22:42:49 · 79 阅读 · 0 评论 -
【RAP】RAP动作与流行舞蹈/街舞
将rap作为街舞的主要风格标准原创 2025-05-15 18:35:23 · 60 阅读 · 0 评论 -
【GIF渲染】windows 渲染 ubutnu 产生的gif 图像
【GIF渲染】windows 渲染 ubutnu 产生的gif 图像原创 2025-05-12 15:35:38 · 46 阅读 · 0 评论 -
【OpenAI】Updating your OpenAI library to the latest version
OpenAI原创 2025-05-09 14:29:02 · 52 阅读 · 0 评论 -
【Mermaid】飞书里的Mermaid代码
飞书里的Mermaid代码原创 2025-04-03 10:53:19 · 333 阅读 · 0 评论 -
【Agent】20250328:WorkTeam多代理框架:使用多智能体从自然语言构建工作流程
workteam 多代理框架 华为论文原创 2025-04-01 12:00:42 · 68 阅读 · 0 评论 -
【Music】读取文件夹及子文件夹所有mp3按照bpm拷贝到不同文件夹
bpmRange = { "超快": (190, 280), "快跑": (160, 190), "慢跑": (140, 160), "快走": (120, 140), "慢走": (100, 120), "超慢": (0, 100)}原创 2025-03-31 18:53:33 · 88 阅读 · 0 评论 -
【Music】BPM和视频剪辑卡点
总的来说,BPM不仅决定了一首歌的**节奏和氛围**,还直接影响到MV中动作的设计和3D UE动作的动画制作。通过对BPM的合理利用,创作者可以更好地实现音乐与视觉动作的完美融合,从而创造出既动感十足又富有情感表达的作品。原创 2025-03-31 18:50:59 · 97 阅读 · 0 评论 -
【UE5.3.2】初学1:适合初学者的入门路线图和建议
UE5初学者7天训练营原创 2025-03-29 11:00:42 · 607 阅读 · 0 评论 -
【Film】节拍:初学者理解「4/4 拍」
4/4 拍 是最常见的拍号之一,也被称为“四四拍”或“C拍”(C 代表 Common Time)。它表示每小节包含 4 个四分音符的时值,也就是说,在一小节内可以有 4 个“1/4拍”的音符,或者等值的音符组合(比如 2 个二分音符、8 个八分音符等)。原创 2025-03-28 14:24:05 · 137 阅读 · 0 评论 -
【RAG】2410 LightRAG 简单快速的检索增强生成 4:dickens 嵌入和查询
async def get_embedding_dim(): test_text = ["This is a test sentence."] embedding = await embedding_func(test_text) embedding_dim = embedding.shape[1] return embedding_dim原创 2025-03-25 18:17:45 · 81 阅读 · 0 评论 -
【RAG】2410 LightRAG 简单快速的检索增强生成 3:运行和测试
【RAG】2410 LightRAG 简单快速的检索增强生成 3:运行和测试原创 2025-03-25 15:11:56 · 104 阅读 · 0 评论 -
【RAG】2410 LightRAG 简单快速的检索增强生成 2:架构、对比和结论
6Conclusion 6 结论This work introduces an advancement in Retrieval-Augmented Generation (RAG) through the integration of a graph-based indexing approach that enhances both efficiency and comprehension in information retrieval. LightRAG utilizes a comprehen原创 2025-03-25 11:51:33 · 80 阅读 · 0 评论 -
【RAG】2410 LightRAG 简单快速的检索增强生成 1
【RAG】2410 LightRAG 简单快速的检索增强生成 1原创 2025-03-25 11:04:42 · 90 阅读 · 0 评论 -
【微调】案例及数据集
案例原创 2025-03-21 11:14:48 · 81 阅读 · 0 评论 -
【Film】对话场景拍摄的常用视线匹配技巧
正确使用180度原则原创 2025-03-20 17:27:05 · 115 阅读 · 0 评论 -
【Film】MovieAgent:自动化电影生成通过多智能体CoT规划
【Film】MovieAgent:自动化电影生成通过多智能体CoT规划原创 2025-03-18 19:59:30 · 282 阅读 · 0 评论 -
【推理】大模型ReasonGraph:推理路径的可视化论文及代码分析
ReasonGraph:推理路径的可视化原创 2025-03-16 18:02:06 · 120 阅读 · 0 评论 -
【Film】MM-StoryAgent 2:源码分析
【Film】MM-StoryAgent 2:源码分析原创 2025-03-14 18:37:20 · 128 阅读 · 0 评论 -
【数字人】HeyGem win11部署
【数字人】HeyGem win11部署原创 2025-03-14 11:54:45 · 1322 阅读 · 0 评论 -
【Film】MM-StoryAgent 1:沉浸式叙事故事书视频生成,具有跨文本、图像和音频的多代理范式
【Film】MM-StoryAgent 1:沉浸式叙事故事书视频生成,具有跨文本、图像和音频的多代理范式原创 2025-03-11 19:30:02 · 225 阅读 · 0 评论 -
【AIGC】文生图 文生视频 运镜 提示词
【AIGC】文生图 文生视频 运镜 提示词原创 2025-03-07 15:56:55 · 416 阅读 · 0 评论 -
【文生图】sd_xl_base_1.0.safetensors
sd_xl_base_1.0.safetensors原创 2025-03-06 18:47:44 · 190 阅读 · 0 评论 -
【Film】 黄金分割、 三分法 、构图
【Film】 黄金分割、 三分法 、构图原创 2025-03-05 18:43:17 · 151 阅读 · 0 评论 -
【文生图】windows 部署stable-diffusion-webui
windows 部署stable-diffusion-webui原创 2025-03-05 14:09:15 · 330 阅读 · 0 评论 -
【Film】我是如何制作我的短片《At the Fort》的
【Film】我是如何制作我的短片《At the Fort》的原创 2025-03-05 12:00:41 · 70 阅读 · 0 评论 -
【Film】How to Make a Movie
如何拍摄电影原创 2025-03-05 10:34:44 · 74 阅读 · 0 评论 -
【python】字典的格式化输出
Python中是一个字典(dictionary),虽然它的格式和JSON非常相似。严格来说,**JSON要求键和值用双引号,但在Python中用单引号表示字符串也是合法的。**原创 2025-03-04 13:05:59 · 105 阅读 · 0 评论 -
【Film】Shot Size in Filmmaking
【Film】Shot Size in Filmmaking原创 2025-03-03 16:38:13 · 61 阅读 · 0 评论 -
【RAG】sPecialized KnowledgE and Rationale Augmented Generation
https://github.com/microsoft/PIKE-RAG/blob/main/docs/guides/env_file.md原创 2025-02-28 09:22:15 · 314 阅读 · 0 评论 -
【langgraph】于langgraph生成摘要
于langgraph生成摘要原创 2025-02-23 01:09:24 · 108 阅读 · 0 评论 -
【ubuntu24.04】pycharm安装pygraphviz
【ubuntu24.04】pycharm安装pygraphviz原创 2025-02-23 01:02:55 · 232 阅读 · 0 评论 -
【精调】MMRole :开发和评估多模式角色扮演代理的综合框架
"请提供一个简短的定性评估,比较两个模型的相对表现,然后给出1到10的配对定量评分,其中1表示表现差,10表示表现优秀。\n\n" "输出格式应如下:\n" "{定性评估}, [评分]: ({模型A的评分}, {模型B的评分})\n\n" "请确保您的评估是公正的,回答的顺序不会影响您的判断。"原创 2025-02-22 17:16:32 · 131 阅读 · 0 评论 -
【精调】LLaMA-Factory 快速开始4 自定义个一个sharegpt数据集并训练
【精调】LLaMA-Factory 快速开始4 自定义个一个sharegpt数据集并训练原创 2025-02-21 19:05:14 · 337 阅读 · 0 评论 -
【精调】LLaMA-Factory 快速开始3: 自定义个一个alpaca 数据集并训练
alpaca原创 2025-02-21 13:04:09 · 206 阅读 · 0 评论 -
【火山方舟】LoRA: SFT最佳实践
## QLoRA(Quantized LoRA)- QLoRA 是LoRA的扩展,它在LoRA的基础上进一步进行了量化(Quantization)。量化是通过降低模型权重表示的精度来进一步减小模型的存储需求和计算量。QLoRA通**过对LoRA方法中的低秩矩阵进行量化**(通常是将权重表示为更低位数的精度,如8位、4位等)来进一步优化模型的存储和计算效率。- 原理:QLoRA对LoRA中的低秩矩阵进行量化,将原本高精度的参数(如32位浮点数)转换为低精度(如8位或4位)。这种量化不仅减少了存储需求原创 2025-02-20 14:38:39 · 178 阅读 · 0 评论 -
【精调】LLaMA-Factory 快速开始2: Meta-Llama-3.1-8B-Instruct中文数据集
【精调】LLaMA-Factory 快速开始2: Meta-Llama-3.1-8B-Instruct中文数据集原创 2025-02-20 12:01:12 · 294 阅读 · 0 评论 -
【Film】论文:2024 视频生成可以取代摄影师吗?生成视频的电影语言研究
总之,随着LoRA组合数量的增加,CLIPLoRA通过保持稳定的电影控制和实现精确的多镜头集成,始终优于所有基线。相比之下,LoRA Merge、LoRA Switc h和LoRA Composite等方法在生成复杂的摄像机运动时表现出不稳定性,往往无法合成多种运动。这些结果突显了CLIPLoRA的优越性,展示了其弥合T2V模型能力与专业电影摄影师专业知识之间差距的潜力。原创 2025-02-20 10:53:49 · 297 阅读 · 0 评论 -
【精调】LLaMA-Factory 快速开始1: Meta-Llama-3.1-8B-Instruct
LLaMA-Factory 快速开始: Meta-Llama-3.1-8B-Instruct原创 2025-02-20 00:38:53 · 282 阅读 · 0 评论