自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(175)
  • 资源 (11)
  • 收藏
  • 关注

原创 视频二创神器-灵魂画手赛道,现在全网AI厂商都能用!

该日志记录了一个视频处理流程:首先从14秒的源视频中每6秒抽取一帧(共3帧),使用Gemini2.5Flash分析视频内容失败后转为模拟数据(搞笑评分0.8-1.0)。随后通过通义千问API将评分最高的第12秒画面转换为1080x1920手绘风格插图,最终合成15秒的MP4视频(原视频+1秒手绘插图)。整个流程耗时约4分钟,包含视频抽帧、内容分析、AI绘图及视频合成四个主要阶段,最终输出文件为"hand_drawn_原视频名_时间戳.mp4"。

2025-10-11 12:37:49 178 1

原创 【原创】MiniCPM-V 4.5模型测试 pk gemini2.5pro 本地8G显卡

【摘要】视频分析显示一个考古团队在复杂洞穴系统中的探索过程。团队成员身着防护装备,在昏暗潮湿环境中调查刻有符号的石板、水下骨骼阵列和佛像壁龛等遗迹。视频包含四个主要场景:巨型生物胸腔状空间的水流奇观、刻有同心圆的水下洞穴、破碎石棺的圆形墓室,以及有机隧道中的神秘黑色物体。分析采用MiniCPM-V4.5模型进行逐帧处理,该模型展现了先进的视觉理解能力,最终生成包含16个时间节点描述和整体总结的JSON格式报告,完整记录了这次充满科幻感的考古探险。

2025-08-29 14:33:49 1104

原创 如何让AI视频模型(如Veo)开口说中文?一个顶级提示词的深度拆解

本文介绍了如何编写AI视频生成提示词,以创建包含特定中文对话的场景。关键技巧包括:1)明确指定语言并提供精确台词;2)构建戏剧冲突的故事场景;3)详细指导镜头语言;4)描绘生动的角色与环境细节。成功的提示词需要包含场景设定、角色细节、明确语言指令、完整中文台词、背景故事和专业镜头指导。掌握这些技巧,就能像导演一样引导AI生成富有故事性的视频作品。

2025-08-17 18:16:29 1050

原创 解决微信版本过低当前微信版本不支持该功能请升级至最新版本下载最新版本

一个真4.0.6.33 一个3.6.0.18。

2025-08-15 20:45:30 990 6

原创 【原创】根据端口查找进程

这篇文章介绍了一款基于Python+Tkinter开发的Windows端口与进程管理工具。该工具具有查询端口占用情况、关联进程信息、筛选监听状态连接、一键结束进程等功能,相比命令行操作更直观高效。文章详细说明了工具的使用场景(如解决端口冲突、排查异常连接)、界面布局和核心优势(可视化操作、信息聚合、轻量化)。最后提供了完整的Python实现代码,包含端口解析、进程管理、GUI界面等核心模块。该工具适合开发者和运维人员快速解决Windows系统下的端口管理问题。

2025-08-14 11:16:24 433

原创 【原创】如何让claude-code gemini-coder 在本地正常运行,无需开Tun,无需开全局

解决Claude API认证错误的方法: 确保settings.json配置正确后仍报错时 需要让Node.js进程通过代理访问Claude API 具体方法: 设置全局代理 或使用axios等库的proxy配置 或在启动命令前添加代理参数 关键点:代理必须能正常访问Claude服务 典型错误:仅配置了文件但未处理网络连接问题 注意:代理设置需与Claude服务区域匹配,确保网络可达性。

2025-08-14 09:10:40 186

原创 【原创】鼠标右键添加自由切换conda环境

一键激活Conda环境:Python脚本实现右键菜单功能 这个实用的Python脚本可以自动为Windows系统添加Conda环境右键菜单功能。主要特点包括: 自动扫描系统所有Conda虚拟环境 在文件夹右键菜单中创建对应环境启动项 点击即可打开CMD并自动激活指定环境 注册表自动维护,避免重复或残留 实现原理是通过winreg模块操作Windows注册表,在HKEY_CLASSES_ROOT/Directory/Background/shell下创建菜单项。使用前需以管理员权限运行脚本,每次环境变更后重新

2025-08-13 18:57:55 415

原创 【原创】基于gemini-2.5-flash-preview-05-20多模态模型实现短视频的自动化二创

本文展示了AI视频处理流程:首先以1帧/秒从83秒视频中提取84帧,通过Gemini视觉API分析生成事件时间轴(5个关键节点);随后调用Gemini生成6段解说文案(含开场、选手反应、成功猜中等);最后通过本地TTS服务合成语音,最终输出带解说音轨的二创视频。整个流程消耗2次云端API调用(视觉分析和文案生成各1次),语音合成采用本地服务实现零云端消耗。系统实现了从视频分析到配音的完整AI自动化处理。

2025-08-05 17:02:21 445

原创 【原创】【5】【视频二创工具发布】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道

摘要:本文展示了一个短视频二创系统的配置文件(config.ini),详细定义了多赛道视频创作的技术参数。文件包含六大核心配置:1) 数据库连接设置(SQLite/MySQL);2) 多AI模型API配置(DeepSeek、Gemma等);3) 赛道专属文案生成提示词(如UFC、外国人少系列);4) 视频处理参数(镜像/调速/裁剪等);5) 评分模型标准(100分制评估体系);6) 路径与水印设置。系统支持自动化视频生成全流程,从内容识别到最终输出,特别强调押韵解说、文化差异呈现等创作特色,并附有百度网盘资

2025-06-30 17:25:03 429

原创 【原创】【4】【辅助工具】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道

短视频批量导入工具是一款高效管理本地视频文件的解决方案,具备智能扫描和自动分类功能。该工具支持递归扫描所有子目录中的视频文件(包括MP4、MOV、AVI、MKV等格式),并能从文件夹名自动识别赛道分类或手动指定。采用双数据库支持(SQLite和MySQL),具有重复文件检测功能,实时显示导入进度。典型应用场景为整理按系列分类的短视频库,自动标记已下载状态并记录本地路径,推荐新手使用配置简单的SQLite数据库进行存储管理。

2025-06-26 11:40:56 339

原创 【原创】【3】【辅助工具】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道

【150字摘要】 该工具提供两大核心功能:一是搬运视频时自动生成字幕并翻译,无需依赖付费软件;二是智能下载功能,先通过Python脚本自动抓取,失败时自动跳转浏览器打开视频链接完成下载。用户关注作者视频号可获取持续更新,实现资源共享与共同发展。工具设计注重实用性与效率,解决字幕处理和下载难题。

2025-06-23 09:11:22 384

原创 【原创】【2】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道

【代码】【原创】【2】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道。

2025-06-20 11:47:52 504

原创 【原创】【1】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道

【AI视频智能处理系统摘要】 本系统为全流程短视频自动化处理平台,支持多赛道视频搬运与二次创作。核心架构采用MySQL任务管理+多AI模型协同(Ollama视觉分析/DeepSeek文案生成/豆包TTS配音),具备六大功能模块:1)赛道差异化配置 2)智能视频解析 3)多模型文案择优 4)专业音频处理链 5)创意效果工具箱 6)可定制处理开关。系统特色包括分层配置管理、并发AI调用、FFmpeg专业级音视频处理及完善容错机制,支持批量处理与微信通知,实现从原始素材到成品视频的全自动生产,适用于内容矩阵运营与

2025-06-08 10:34:55 2018 2

原创 【原创】instagram 批量下载工具

获取视频链接,导入功能。

2025-05-21 13:54:38 295

原创 【原创】豆包高清无码图片下载

点击后立即下载高清无水印图片。1.浏览器edge,安装油猴。不会跳转,不会打开新标签页。打开打包,生成图片,

2025-05-19 11:21:35 616

原创 【原创】基于视觉大模型gemma-3-4b实现短视频自动识别内容并生成解说文案

该工具旨在自动化生成短视频解说内容,主要功能包括视频抽帧、多模态图像识别、文案生成、TTS语音合成和视频合成。通过从原始视频中提取关键帧,利用多模态模型识别每帧图像内容,生成口语化的解说文案,并将其转换为音频,最终将图片和音频合成为短视频。工具还支持日志记录和文案保存,适用于内容创作、短视频自动剪辑辅助等场景。代码架构清晰,包含拆帧、图像识别、文案生成、音频合成和视频合成等模块,并可通过配置文件进行模型和相关参数的设置。未来可扩展方向包括加字幕、多语言支持、语音识别、图像字幕识别和批量处理视频等功能。

2025-05-17 19:54:09 1200

原创 【原创】python给软件加授权+临时授权+正式授权

该脚本实现了一个图像生成客户端,具备授权管理、后端调用、本地下载和UI反馈功能。授权管理包括正式授权和试用授权,通过RSA公钥和HMAC签名验证授权文件的合法性,防止篡改。试用授权提供6个月的安全试用期,过期后提示用户并退出。核心功能是通过HTTP请求调用后端图像生成接口,实时解析并下载图片到本地,下载进度通过界面实时反馈。图形化界面使用Tkinter构建,主窗体显示授权状态、提示词输入框和运行信息,生成与下载任务在独立线程中执行,确保界面不卡顿。整体上,该脚本集成了授权保护、图像生成与下载、用户界面反馈等

2025-05-16 08:52:25 784 1

原创 【原创】免费好用的万年历API接口

万年历接口要么收费要么免费的有次数限制。

2025-05-08 16:00:56 690

原创 【原创】批量区分横屏竖屏照片

程序会在指定的目录下创建两个子文件夹,并将图片分类复制到对应的文件夹中。原始图片保持不变,所以您不用担心图片丢失。

2025-05-06 14:52:02 548

原创 【原创】从s3桶将对象导入ES建立索引,以便快速查找文件

这段程序实现了自动同步S3文件列表到Elasticsearch索引,方便对存储桶中的文件进行快速搜索和查询import ("bytes""context""fmt""log""net/http""time"if err!= nil {log.Fatalf("无法读取配置文件: %v", err)})if err!= nil {log.Printf("获取 %s 的ETag失败: %v", fileKey, err)return ""})if err!= nil {

2025-04-28 09:41:24 535

原创 【原创】视频号自动上传工具,基于playwright

技术用途Playwright浏览器自动化Redis任务队列schedule定时刷新页面logging日志记录JSON任务结构文件管理与时间调度。

2025-04-25 14:06:44 737

原创 bat快速激活python虚拟环境

【代码】bat快速激活python虚拟环境。

2025-04-21 10:30:59 472

原创 ubuntu22.04 安装Jitsi meet 开源会议系统,代替腾讯会议

域名一定要有ssl证书,域名一定要有ssl证书,域名一定要有ssl证书,域名一定要有ssl证书,一定要用域名访问, 一定要用域名访问, 一定要用域名访问, 一定要用域名访问,Ubuntu 22.04系统。

2025-03-25 11:16:38 872

原创 开源ASR选择

针对你的需求(),我们需要一个在方面都表现优秀的模型。

2025-03-21 16:56:00 839

原创 【原创】通过S3接口将海量文件索引导入elasticsearch

在医院海量影像文件通过s3传到蓝光存储时,要找一个文件需要全部文件遍历一遍,效率非常非常低。

2025-03-21 14:12:56 526

原创 将python代码打包成小小exe,比pyinstaller好用

我原来代码是python的,但是打包成exe后文件非常大,我想要体积小的exe文件,方便拷贝到其他win电脑上运行。

2025-03-21 09:03:06 1678

原创 【原创】python授权加密

要让软件授权码(License Key)更安全,并能限定服务器和使用时间,通常可以结合等方式来增强安全性。使用(如防止授权码在多个设备上使用,可以绑定(如 CPU ID、MAC 地址、硬盘序列号等)。授权码应包含为了防止授权码被篡改,可以使用或时,客户端用相同的secret_key计算签名并校验。为了更安全,可以使用如果是企业级产品,建议采用的方式,避免破解和滥用。

2025-03-20 18:16:06 1377

原创 PHPCMS V9 登录加密改造

要改造的后台登录,使其前端使用加密方式提交,后端解密,你可以采用或方式来增强安全性。

2025-03-11 17:36:32 568

原创 git clone Failed to connect to github.com port 443: Timed out

【代码】git clone Failed to connect to github.com port 443: Timed out。

2025-03-06 14:22:32 148

原创 黑群辉 无法安装此文件,文件可能已经毁损。 (13)

链接: https://pan.baidu.com/s/1yu2Fn4Sk-uGaS2wWcUO7HQ?pwd=cu9d 提取码: cu9d。换了主板,换了u盘引导盘,重新刻录,重新安装,原来硬盘上数据会还在。通过网盘分享的文件:DSM6.2。

2025-02-27 17:28:54 1682

原创 [原创]openwebui解决searxng通过接口请求不成功问题

时 无法查询到联网信息,使用bing搜索,每次返回json是正常的。官方教程是这样设置的 非常不稳定,经常搜索不到结果。openwebui 对接。

2025-02-27 12:22:50 4072

原创 Tesla T4 显卡 Linux 64-bit Ubuntu 24.04 驱动和cuda系统支持版本

每个驱动程序版本旁边都有文件大小、发布日期等信息。每个版本都可以通过“下载”按钮进行下载。:页面底部列出了NVIDIA的其他产品、技术支持、以及一些有用的链接,比如。如果你有任何具体问题,或者需要查看某个版本的详情,可以告诉我!:每个驱动程序的安装包似乎都有两个选项:一个是。等NVIDIA数据中心GPU提供驱动程序。版本的安装包,另一个是标准的驱动安装包。:页面列出了不同版本的。:页面展示的是适用于。

2025-02-21 08:41:28 1227

原创 Open WebUI 版本 v0.5.10(最新版)普通用户无法查看模型解决

新版本,默认模型是普通用户无法查看的。可见性设置公共就可以了。

2025-02-13 11:24:01 2536 1

原创 DeepSeek R1+Open WebUI +SearXNG 本地化部署与联网功能

DeepSeek R1+Open WebUI +SearXNG 本地化部署与联网功能

2025-02-12 16:11:51 1227 5

原创 System.Data.OracleClient 需要 Oracle 客户端软件 version 8.1.7 或更高版本

未能加载文件或程序集“Sybase.PowerBuilder.Interop.DLL”或它的某一个依赖项。异常详细信息: System.IO.FileNotFoundException: 未能加载文件或程序集“Sybase.PowerBuilder.Interop.DLL”或它的某一个依赖项。问题1:“/”应用程序中的服务器错误。异常详细信息: System.Exception: System.Data.OracleClient 需要 Oracle 客户端软件 version 8.1.7 或更高版本。

2024-12-10 09:53:30 1914

原创 fastadmin二级管理员添加导入权限

创建菜单,配置权限。

2024-11-04 10:09:29 338

原创 【原创】一键安装和更新ollama脚本

在首次安装时,脚本会提示输入模型保存路径,之后自动下载、安装。

2024-10-21 14:27:40 2085

原创 【原创】同声传译,llm tts ars 通通流式输出

基于Sambanova API 实现流式同声传译功能。

2024-10-14 15:31:54 895 1

原创 【原创】基于websocket的实时文本转语音功能

ESP-AI开发者平台服务配置教程(小白一样玩转智能助手 硬件+软件),天问 asrpro 唤醒 ESP-AI教程,【AI主播-TTS篇】对接 CosyVoice API Win 0819,整体很简单,懂得不看也没啥问题,【开源项目】Mini-Omni 一个开源的多模态大型语言模型,可以边听边说边思考。功能实现,将长文本分段实时转成音频流,达到边转换边播放的效果,减少等待效果,像豆包通义千问chatgpt差不多也是这样实现的,20240930_084035_哔哩哔哩_bilibili。

2024-09-30 08:46:35 2124 2

原创 【原创】迁移oracle数据库,报错oracleorcl: error while loading shared libraries: libodm11.so: cannot open share

【代码】系统克隆后,迁移oracle数据库,报错oracleorcl: error while loading shared libraries: libodm11.so: cannot open share。

2024-09-27 12:03:03 283

华为ONU配置脚本(含配置静态vlan)

华为ONU配置脚本(含配置静态vlan)

2012-12-11

GPON典型组网配置指南.doc

MA5600T GPON典型组网配置指南

2012-12-11

GPON FTTB:MA5600T+MA562XG上机指导书(宽带,语音,组播业务)-

GPON FTTB:MA5600T+MA562XG上机指导书(宽带,语音,组播业务)-20090112-B.doc

2012-12-11

centos7一键离线安装NFS服务 离线安装包

配合一键安装包使用

2024-07-04

2024.2.22亲测esxi6.7支持 r8168

ESXi-6.7.0-20191204001-standard-customized-all-v2 亲测esxi6.7支持 x99主板 带2个网卡型号r8168

2024-02-22

m3u8播放器源码 ,ckplayer播放m3u8

m3u8播放器源码 ,ckplayer播放m3u8 官方文件下载 修改为m3u8地址

2022-09-20

opencv_python-4.2.0.34-cp38-cp38-win_amd64.whl

OpenCV的全称是:Open Source Computer Vision Library。OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。

2020-04-23

cx341a win2016驱动-MLNX_VPI_WinOF-5_50_53000_All_Win2016_x64.exe

cx341a win2016驱动;MLNX_VPI_WinOF-5_50_53000_All_Win2016_x64.exe,为ConnectX-3和ConnectX-3 Pro驱动程序下载WinOF。

2021-03-24

GPON ONU无法上线故障处理 01.zip

由于设备故障或者传输网络问题,出现GPON ONU无法上线故障,导致业务无法正常开展。本文主要从以下方面介绍GPON ONU无法上线故障的常用处理方法。

2019-05-14

yolov5Pt模型.zip

YOLOv5s 640 36.7 36.7 55.4 2.0 7.3 17.0 YOLOv5m 640 44.5 44.5 63.1 2.7 21.4 51.3 YOLOv5l 640 48.2 48.2 66.9 3.8 47.0 115.4 YOLOv5x 640 50.4 50.4 68.8 6.1 87.7 218.8 YOLOv5s6 1280 43.3 43.3 61.9 4.3 12.7 17.4 YOLOv5m6 1280 50.5 50.5 68.7 8.4 35.9 52.4 YOLOv5l6 1280 53.4 53.4 71.1 12.3 77.2 117.7 YOLOv5x6 1280 54.4 54.4 72.0 22.4 141.8 222.9 YOLOv5x6 TTA 1280 55.0 55.0 72.0 70.8 - -

2021-08-01

小蚂蚁地方门户aspnet源码

小蚂蚁地方门户aspnet源码,很强大,什么功能都有

2013-11-22

附件2-MA5600T V800R018C10SPH203 xPON终端配套说明 01.pdf

附件2-MA5600T V800R018C10SPH203 xPON终端配套说明 01.pdf

2019-06-12

U2000 CORBA接口操作和维护指导-20100818-A.ppt

U2000 CORBA接口操作和维护指导了解U2000 CORBA接口运行和工作原理 掌握CORBA接口部署过程中的注意事项 能够独立进行CORBA接口部署和验证 能够独立进行CORBA接口简单问题排障

2019-06-09

jq时间选择.zip

jquery日期时间选择插件 flatpickr多种风格可选 query支持快速选择时间的双日期选择input插件代码

2020-02-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除