- 博客(175)
- 资源 (11)
- 收藏
- 关注
原创 视频二创神器-灵魂画手赛道,现在全网AI厂商都能用!
该日志记录了一个视频处理流程:首先从14秒的源视频中每6秒抽取一帧(共3帧),使用Gemini2.5Flash分析视频内容失败后转为模拟数据(搞笑评分0.8-1.0)。随后通过通义千问API将评分最高的第12秒画面转换为1080x1920手绘风格插图,最终合成15秒的MP4视频(原视频+1秒手绘插图)。整个流程耗时约4分钟,包含视频抽帧、内容分析、AI绘图及视频合成四个主要阶段,最终输出文件为"hand_drawn_原视频名_时间戳.mp4"。
2025-10-11 12:37:49
178
1
原创 【原创】MiniCPM-V 4.5模型测试 pk gemini2.5pro 本地8G显卡
【摘要】视频分析显示一个考古团队在复杂洞穴系统中的探索过程。团队成员身着防护装备,在昏暗潮湿环境中调查刻有符号的石板、水下骨骼阵列和佛像壁龛等遗迹。视频包含四个主要场景:巨型生物胸腔状空间的水流奇观、刻有同心圆的水下洞穴、破碎石棺的圆形墓室,以及有机隧道中的神秘黑色物体。分析采用MiniCPM-V4.5模型进行逐帧处理,该模型展现了先进的视觉理解能力,最终生成包含16个时间节点描述和整体总结的JSON格式报告,完整记录了这次充满科幻感的考古探险。
2025-08-29 14:33:49
1104
原创 如何让AI视频模型(如Veo)开口说中文?一个顶级提示词的深度拆解
本文介绍了如何编写AI视频生成提示词,以创建包含特定中文对话的场景。关键技巧包括:1)明确指定语言并提供精确台词;2)构建戏剧冲突的故事场景;3)详细指导镜头语言;4)描绘生动的角色与环境细节。成功的提示词需要包含场景设定、角色细节、明确语言指令、完整中文台词、背景故事和专业镜头指导。掌握这些技巧,就能像导演一样引导AI生成富有故事性的视频作品。
2025-08-17 18:16:29
1050
原创 【原创】根据端口查找进程
这篇文章介绍了一款基于Python+Tkinter开发的Windows端口与进程管理工具。该工具具有查询端口占用情况、关联进程信息、筛选监听状态连接、一键结束进程等功能,相比命令行操作更直观高效。文章详细说明了工具的使用场景(如解决端口冲突、排查异常连接)、界面布局和核心优势(可视化操作、信息聚合、轻量化)。最后提供了完整的Python实现代码,包含端口解析、进程管理、GUI界面等核心模块。该工具适合开发者和运维人员快速解决Windows系统下的端口管理问题。
2025-08-14 11:16:24
433
原创 【原创】如何让claude-code gemini-coder 在本地正常运行,无需开Tun,无需开全局
解决Claude API认证错误的方法: 确保settings.json配置正确后仍报错时 需要让Node.js进程通过代理访问Claude API 具体方法: 设置全局代理 或使用axios等库的proxy配置 或在启动命令前添加代理参数 关键点:代理必须能正常访问Claude服务 典型错误:仅配置了文件但未处理网络连接问题 注意:代理设置需与Claude服务区域匹配,确保网络可达性。
2025-08-14 09:10:40
186
原创 【原创】鼠标右键添加自由切换conda环境
一键激活Conda环境:Python脚本实现右键菜单功能 这个实用的Python脚本可以自动为Windows系统添加Conda环境右键菜单功能。主要特点包括: 自动扫描系统所有Conda虚拟环境 在文件夹右键菜单中创建对应环境启动项 点击即可打开CMD并自动激活指定环境 注册表自动维护,避免重复或残留 实现原理是通过winreg模块操作Windows注册表,在HKEY_CLASSES_ROOT/Directory/Background/shell下创建菜单项。使用前需以管理员权限运行脚本,每次环境变更后重新
2025-08-13 18:57:55
415
原创 【原创】基于gemini-2.5-flash-preview-05-20多模态模型实现短视频的自动化二创
本文展示了AI视频处理流程:首先以1帧/秒从83秒视频中提取84帧,通过Gemini视觉API分析生成事件时间轴(5个关键节点);随后调用Gemini生成6段解说文案(含开场、选手反应、成功猜中等);最后通过本地TTS服务合成语音,最终输出带解说音轨的二创视频。整个流程消耗2次云端API调用(视觉分析和文案生成各1次),语音合成采用本地服务实现零云端消耗。系统实现了从视频分析到配音的完整AI自动化处理。
2025-08-05 17:02:21
445
原创 【原创】【5】【视频二创工具发布】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道
摘要:本文展示了一个短视频二创系统的配置文件(config.ini),详细定义了多赛道视频创作的技术参数。文件包含六大核心配置:1) 数据库连接设置(SQLite/MySQL);2) 多AI模型API配置(DeepSeek、Gemma等);3) 赛道专属文案生成提示词(如UFC、外国人少系列);4) 视频处理参数(镜像/调速/裁剪等);5) 评分模型标准(100分制评估体系);6) 路径与水印设置。系统支持自动化视频生成全流程,从内容识别到最终输出,特别强调押韵解说、文化差异呈现等创作特色,并附有百度网盘资
2025-06-30 17:25:03
429
原创 【原创】【4】【辅助工具】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道
短视频批量导入工具是一款高效管理本地视频文件的解决方案,具备智能扫描和自动分类功能。该工具支持递归扫描所有子目录中的视频文件(包括MP4、MOV、AVI、MKV等格式),并能从文件夹名自动识别赛道分类或手动指定。采用双数据库支持(SQLite和MySQL),具有重复文件检测功能,实时显示导入进度。典型应用场景为整理按系列分类的短视频库,自动标记已下载状态并记录本地路径,推荐新手使用配置简单的SQLite数据库进行存储管理。
2025-06-26 11:40:56
339
原创 【原创】【3】【辅助工具】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道
【150字摘要】 该工具提供两大核心功能:一是搬运视频时自动生成字幕并翻译,无需依赖付费软件;二是智能下载功能,先通过Python脚本自动抓取,失败时自动跳转浏览器打开视频链接完成下载。用户关注作者视频号可获取持续更新,实现资源共享与共同发展。工具设计注重实用性与效率,解决字幕处理和下载难题。
2025-06-23 09:11:22
384
原创 【原创】【2】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道
【代码】【原创】【2】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道。
2025-06-20 11:47:52
504
原创 【原创】【1】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道
【AI视频智能处理系统摘要】 本系统为全流程短视频自动化处理平台,支持多赛道视频搬运与二次创作。核心架构采用MySQL任务管理+多AI模型协同(Ollama视觉分析/DeepSeek文案生成/豆包TTS配音),具备六大功能模块:1)赛道差异化配置 2)智能视频解析 3)多模型文案择优 4)专业音频处理链 5)创意效果工具箱 6)可定制处理开关。系统特色包括分层配置管理、并发AI调用、FFmpeg专业级音视频处理及完善容错机制,支持批量处理与微信通知,实现从原始素材到成品视频的全自动生产,适用于内容矩阵运营与
2025-06-08 10:34:55
2018
2
原创 【原创】基于视觉大模型gemma-3-4b实现短视频自动识别内容并生成解说文案
该工具旨在自动化生成短视频解说内容,主要功能包括视频抽帧、多模态图像识别、文案生成、TTS语音合成和视频合成。通过从原始视频中提取关键帧,利用多模态模型识别每帧图像内容,生成口语化的解说文案,并将其转换为音频,最终将图片和音频合成为短视频。工具还支持日志记录和文案保存,适用于内容创作、短视频自动剪辑辅助等场景。代码架构清晰,包含拆帧、图像识别、文案生成、音频合成和视频合成等模块,并可通过配置文件进行模型和相关参数的设置。未来可扩展方向包括加字幕、多语言支持、语音识别、图像字幕识别和批量处理视频等功能。
2025-05-17 19:54:09
1200
原创 【原创】python给软件加授权+临时授权+正式授权
该脚本实现了一个图像生成客户端,具备授权管理、后端调用、本地下载和UI反馈功能。授权管理包括正式授权和试用授权,通过RSA公钥和HMAC签名验证授权文件的合法性,防止篡改。试用授权提供6个月的安全试用期,过期后提示用户并退出。核心功能是通过HTTP请求调用后端图像生成接口,实时解析并下载图片到本地,下载进度通过界面实时反馈。图形化界面使用Tkinter构建,主窗体显示授权状态、提示词输入框和运行信息,生成与下载任务在独立线程中执行,确保界面不卡顿。整体上,该脚本集成了授权保护、图像生成与下载、用户界面反馈等
2025-05-16 08:52:25
784
1
原创 【原创】从s3桶将对象导入ES建立索引,以便快速查找文件
这段程序实现了自动同步S3文件列表到Elasticsearch索引,方便对存储桶中的文件进行快速搜索和查询import ("bytes""context""fmt""log""net/http""time"if err!= nil {log.Fatalf("无法读取配置文件: %v", err)})if err!= nil {log.Printf("获取 %s 的ETag失败: %v", fileKey, err)return ""})if err!= nil {
2025-04-28 09:41:24
535
原创 【原创】视频号自动上传工具,基于playwright
技术用途Playwright浏览器自动化Redis任务队列schedule定时刷新页面logging日志记录JSON任务结构文件管理与时间调度。
2025-04-25 14:06:44
737
原创 ubuntu22.04 安装Jitsi meet 开源会议系统,代替腾讯会议
域名一定要有ssl证书,域名一定要有ssl证书,域名一定要有ssl证书,域名一定要有ssl证书,一定要用域名访问, 一定要用域名访问, 一定要用域名访问, 一定要用域名访问,Ubuntu 22.04系统。
2025-03-25 11:16:38
872
原创 【原创】通过S3接口将海量文件索引导入elasticsearch
在医院海量影像文件通过s3传到蓝光存储时,要找一个文件需要全部文件遍历一遍,效率非常非常低。
2025-03-21 14:12:56
526
原创 将python代码打包成小小exe,比pyinstaller好用
我原来代码是python的,但是打包成exe后文件非常大,我想要体积小的exe文件,方便拷贝到其他win电脑上运行。
2025-03-21 09:03:06
1678
原创 【原创】python授权加密
要让软件授权码(License Key)更安全,并能限定服务器和使用时间,通常可以结合等方式来增强安全性。使用(如防止授权码在多个设备上使用,可以绑定(如 CPU ID、MAC 地址、硬盘序列号等)。授权码应包含为了防止授权码被篡改,可以使用或时,客户端用相同的secret_key计算签名并校验。为了更安全,可以使用如果是企业级产品,建议采用的方式,避免破解和滥用。
2025-03-20 18:16:06
1377
原创 git clone Failed to connect to github.com port 443: Timed out
【代码】git clone Failed to connect to github.com port 443: Timed out。
2025-03-06 14:22:32
148
原创 黑群辉 无法安装此文件,文件可能已经毁损。 (13)
链接: https://pan.baidu.com/s/1yu2Fn4Sk-uGaS2wWcUO7HQ?pwd=cu9d 提取码: cu9d。换了主板,换了u盘引导盘,重新刻录,重新安装,原来硬盘上数据会还在。通过网盘分享的文件:DSM6.2。
2025-02-27 17:28:54
1682
原创 [原创]openwebui解决searxng通过接口请求不成功问题
时 无法查询到联网信息,使用bing搜索,每次返回json是正常的。官方教程是这样设置的 非常不稳定,经常搜索不到结果。openwebui 对接。
2025-02-27 12:22:50
4072
原创 Tesla T4 显卡 Linux 64-bit Ubuntu 24.04 驱动和cuda系统支持版本
每个驱动程序版本旁边都有文件大小、发布日期等信息。每个版本都可以通过“下载”按钮进行下载。:页面底部列出了NVIDIA的其他产品、技术支持、以及一些有用的链接,比如。如果你有任何具体问题,或者需要查看某个版本的详情,可以告诉我!:每个驱动程序的安装包似乎都有两个选项:一个是。等NVIDIA数据中心GPU提供驱动程序。版本的安装包,另一个是标准的驱动安装包。:页面列出了不同版本的。:页面展示的是适用于。
2025-02-21 08:41:28
1227
原创 Open WebUI 版本 v0.5.10(最新版)普通用户无法查看模型解决
新版本,默认模型是普通用户无法查看的。可见性设置公共就可以了。
2025-02-13 11:24:01
2536
1
原创 DeepSeek R1+Open WebUI +SearXNG 本地化部署与联网功能
DeepSeek R1+Open WebUI +SearXNG 本地化部署与联网功能
2025-02-12 16:11:51
1227
5
原创 System.Data.OracleClient 需要 Oracle 客户端软件 version 8.1.7 或更高版本
未能加载文件或程序集“Sybase.PowerBuilder.Interop.DLL”或它的某一个依赖项。异常详细信息: System.IO.FileNotFoundException: 未能加载文件或程序集“Sybase.PowerBuilder.Interop.DLL”或它的某一个依赖项。问题1:“/”应用程序中的服务器错误。异常详细信息: System.Exception: System.Data.OracleClient 需要 Oracle 客户端软件 version 8.1.7 或更高版本。
2024-12-10 09:53:30
1914
原创 【原创】基于websocket的实时文本转语音功能
ESP-AI开发者平台服务配置教程(小白一样玩转智能助手 硬件+软件),天问 asrpro 唤醒 ESP-AI教程,【AI主播-TTS篇】对接 CosyVoice API Win 0819,整体很简单,懂得不看也没啥问题,【开源项目】Mini-Omni 一个开源的多模态大型语言模型,可以边听边说边思考。功能实现,将长文本分段实时转成音频流,达到边转换边播放的效果,减少等待效果,像豆包通义千问chatgpt差不多也是这样实现的,20240930_084035_哔哩哔哩_bilibili。
2024-09-30 08:46:35
2124
2
原创 【原创】迁移oracle数据库,报错oracleorcl: error while loading shared libraries: libodm11.so: cannot open share
【代码】系统克隆后,迁移oracle数据库,报错oracleorcl: error while loading shared libraries: libodm11.so: cannot open share。
2024-09-27 12:03:03
283
GPON FTTB:MA5600T+MA562XG上机指导书(宽带,语音,组播业务)-
2012-12-11
2024.2.22亲测esxi6.7支持 r8168
2024-02-22
opencv_python-4.2.0.34-cp38-cp38-win_amd64.whl
2020-04-23
cx341a win2016驱动-MLNX_VPI_WinOF-5_50_53000_All_Win2016_x64.exe
2021-03-24
GPON ONU无法上线故障处理 01.zip
2019-05-14
yolov5Pt模型.zip
2021-08-01
附件2-MA5600T V800R018C10SPH203 xPON终端配套说明 01.pdf
2019-06-12
U2000 CORBA接口操作和维护指导-20100818-A.ppt
2019-06-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅