自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(140)
  • 收藏
  • 关注

原创 2025-06-13【api】阿里百炼api调用方法

本文展示了三种调用大模型API实现图像理解的方法,均基于阿里云DashScope平台。方法一通过环境变量配置API密钥,方法二直接写入密钥,方法三支持本地图片识别(需base64编码)。三种方式均使用"qwen-vl-max-latest"模型,可完成图片内容描述、风格识别等任务,代码示例完整展现了从初始化客户端到解析返回结果的全流程。这些方法适用于文生文、文生图、多模态理解等AI应用场景。

2025-06-13 00:14:53 42

原创 2025-06-11[批量裁剪素材视频]

本文介绍了一个使用FFmpeg进行视频批量处理的Python脚本。该脚本主要功能包括:1)获取视频原始尺寸和时长;2)将视频缩放至目标尺寸500x450的中间区域;3)计算9种不同的裁剪位置(3x3网格);4)根据需要拼接多个视频片段以达到目标时长180秒;5)为视频添加上下黑色填充区域(上方180像素,下方270像素),最终输出850像素高度的视频。脚本采用线程池实现并行处理,并包含详细的错误处理和日志输出功能。通过FFmpeg滤镜链实现复杂的视频处理流程,包括缩放、裁剪、翻转、拼接和填充等操作。

2025-06-12 01:26:07 54

原创 2025-06-12【合成视频】

一个简单的视频合成任务,没有想到deepseek,豆包,qwen3.0等国内所谓顶级的模型居然搞了5个小时没有搞出来。实在没办法上梯子到GPT最普通的模型里输入同样的问题。30秒搞定,计算了一下国产众多模型浪费了我多少时间。国产仍需努力,别再天天吹牛B了。

2025-06-12 01:16:49 72

原创 2025-06-09(批量智能裁剪视频尺寸并延长视频时长)

print(f" 使用镜像模式: {mirror_mode}, 裁剪位置: {crop_position}")print(f" 原始尺寸: {width}x{height}, 时长: {duration:.2f}秒")print(f"处理 {filename} 时出错: {str(e)}")print(f"目标尺寸: {TARGET_WIDTH}x{TARGET_HEIGHT}")"""批量处理目录中的所有MP4视频文件""""""获取视频的宽度、高度和时长""""""处理单个视频文件"""

2025-06-10 00:21:21 354

原创 2025-05-30[日常思考]利用人工智能技术识别一张图片是否“好看”或符合设计/摄影美感

利用人工智能技术识别一张图片是否“好看”或符合设计/摄影美感,是一个结合计算机视觉、深度学习和美学评价的复杂任务。,AI已能在特定场景下达到接近专业摄影师的审美判断水平。,AI评分应作为辅助工具而非绝对标准。

2025-05-30 01:46:55 810

原创 2025-05-29[日常思考]如何批量筛选符合审美要求的图片?

摘要:该Python脚本实现了一个"美学图片筛选器",可批量筛选符合"画面干净、简洁、造型简单、色彩统一"标准的图片。通过计算机视觉技术分析图片的清晰度(拉普拉斯方差)、边缘复杂度、留白比例和主色分布等特征,结合K-means聚类算法提取主色。脚本提供可配置的筛选阈值(清晰度、主色数量、边缘复杂度等),并计算综合评分。使用OpenCV处理图像,最终将符合标准的图片自动保存到指定目录,适用于需要批量筛选简约风格图片的应用场景。

2025-05-30 00:42:05 825

原创 2025-05-29[日常思考]如何从众从的图片中挑选是图像画面干净,简洁,造型简单,色彩统一,符合视觉审美的图片?

简洁美学图片筛选指南 如何挑选符合"画面干净、简洁、造型简单、色彩统一"且具美感的图片?核心在于建立清晰的评判标准和高效的筛选流程。 筛选标准: 干净简洁:主体突出、背景纯粹、元素精简 造型简单:几何形态、细节克制、结构明了 色彩统一:色调和谐、配色精简、分布有序 视觉美感:平衡稳定、焦点明确、留白得当 筛选方法: 快速预览:凭直觉初选 逐项评判:对照标准审核 重点关注:负空间运用和色彩模式 技术把关:确保清晰度和纯净度 关键原则:少即是多,主体为王,善用留白,色彩克制。通过多看优秀作品

2025-05-30 00:39:53 328

原创 2025-05-26从图片提取书法文字元素的思路(待测试)

首先,用户可能有很多类似的书法图片,想要批量处理里面的文字图形。还要推荐一些现成的工具,比如Adobe Illustrator的图像描摹功能,或者在线工具如Convertio,这样非技术用户也能操作。另外,用户可能需要保持文字的书法风格,而不仅仅是识别内容,所以提取文字图形而不是识别文字本身。最后,提醒用户注意书法字体的特殊性,比如连笔、飞白效果,这些可能导致分割困难,可能需要手动调整参数或后处理。用户之前让我分析了一张元宵佳节主题的图片,现在他们问如何批量提取这种书法类型的图片里的文字图形。

2025-05-26 09:38:41 314

原创 2025-05-25根据单词字母数量进行筛选出高频使用单词

re: 关于(有时用作“regarding”的简写)em: 电子邮件(有时用作“email”的简写)rev: Revolution的缩写。able: 能够的,有能力的。baby: 婴儿,孩子气的人。afar: 遥远地,在远处。aged: 年老的,陈年的。airy: 空气的,通风的。ally: 同盟国,同盟者。avid: 渴望的,热心的。bare: 赤裸的;anti: 反对的,反的。auto: 汽车,自动的。bent: 弯曲的;bore: 令人讨厌的人。fast: 快速的;hah: 哈哈(笑声)

2025-05-25 00:42:19 714

原创 2025-05-10-FFmepg库裁切有水印的视频

该代码使用Python和FFmpeg工具裁剪视频,去除视频底部的水印。首先,通过ffprobe获取视频的分辨率,然后计算裁剪后的高度。接着,使用ffmpeg命令对视频进行裁剪,保留原始宽度,减少高度以去除水印部分。裁剪后的视频保存为新的文件。代码中,crop_height参数用于指定裁剪的高度,用户可以根据水印的实际高度进行调整。整个过程自动化,适用于批量处理带水印的视频文件。

2025-05-09 17:25:02 451

原创 2025-05-09FFmepg根据音频,字幕,指定的字体合成了视频

文章介绍了一个Python脚本,用于将背景视频、音频和字幕合成为一个最终的视频文件。脚本首先通过ffprobe获取音频和视频的时长,然后使用ffmpeg调整视频速度以匹配音频时长。接着,脚本将调整后的视频、音频和字幕进行合成,生成最终的视频文件。整个过程包括获取时长、调整速度、添加字幕和输出视频等步骤,最终生成的文件保存为指定路径的MP4格式。

2025-05-09 17:07:17 234

原创 2025-05-08-调用deepseek api将句子按要求进行拆分

SENTENCES = [[“每天”, “为什么”, “那么累”], [“没有”, “心气”, “没有动力”]]原标题title = “你每天为什么那么累?

2025-05-08 01:11:28 87

原创 2025-05-08-如何在一次 cmd 会话中批量设置多个 API key?

在 Windows 的 cmd 命令行中,你可以使用 set 命令来设置环境变量,例如设置多个不同语言大模型的 API key。下面是一个示例,展示如何在一次 cmd 会话中批量设置多个 API key。⚠️ 注意:setx 设置的是 永久用户变量,它不会在当前 cmd 会话中生效。⚠️ 一旦你关闭这个命令行窗口,这些设置就会失效。✅ 方法二:批处理文件 .bat(推荐批量执行)✅ 方法一:临时设置(仅在当前会话中有效)✅ 方法三:永久设置(全局环境变量,慎用)🧠 Python 中如何读取这些变量?

2025-05-07 14:55:09 133

原创 2025-05-07-关于API Key 的安全管理办法

通过使用 环境变量 或 配置文件 ,你可以有效地避免 API Key 被硬编码在代码中,从而提升项目的安全性。为了确保 API Key 的安全性,避免将敏感信息硬编码在代码中,我们可以使用 环境变量 或 配置文件 来管理敏感信息。使用配置文件(如 .env 或 config.json)也是一种常见的做法,尤其适合本地开发。为了防止 .env 文件被意外提交到 Git 仓库,你需要将它添加到 .gitignore 文件中。✅ 方法二:使用配置文件(如 .env 或 config.json)

2025-05-07 14:39:15 235

原创 2025-05-07-FFmpeg视频裁剪(尺寸调整,画面比例不变)

🚀 为什么 FFmpeg 命令行最快?专为多媒体处理优化FFmpeg 是专业的多媒体框架,底层采用 C 语言实现,编码效率极高。支持 硬件加速 (如 NVENC、VAAPI),大幅提升处理速度。可通过参数(如 -preset ultrafast)进一步优化编码速度。最小化 I/O 开销直接读写文件,无需通过 Python 或其他语言的封装层。可并行处理多个流(如视频和音频)。

2025-05-07 13:22:56 894

原创 python编程相关的单词

comprehension的拼写是c,o,m,p,r,e,h,e,n,s,i,o,n.再读一次c,o,m,p,r,e,h,e,n,s,i,o,n。caseinsensitive的拼写是c,a,s,e,i,n,s,e,n,s,i,t,i,v,e.再读一次c,a,s,e,i,n,s,e,n,s,i,t,i,v,e。positionalonly的拼写是p,o,s,i,t,i,o,n,a,l,o,n,l,y.再读一次p,o,s,i,t,i,o,n,a,l,o,n,l,y。positionale: 位置的。

2025-04-25 21:02:16 661

原创 03_通过调用deepseekapi按专业进行解释单词

list: 在Python中,列表是一种有序的集合,它可以存储多个元素,可以重复,可以嵌套。items: 在编程中,"items"通常指集合中的元素,比如字典中的键值对或列表中的项。and: 在编程中,"and"通常作为逻辑运算符使用,表示两个条件同时为真时结果为真。with: 在编程中,"with"通常用于with语句,用于简化资源管理,如文件操作。the: 在编程中,"the"通常作为普通英文单词使用,没有特定的编程含义。you: 在编程中,"you"通常作为普通英文单词使用,没有特定的编程含义。

2025-04-25 00:43:53 132

原创 02_通过调用硅基流动平台deepseekapi按输入的标题生成文章

通过调用硅基流动平台deepseekapi按输入的标题生成文章

2025-04-13 23:53:37 253

原创 01_通过调过api文字生成音频示例

第7生成api_key。

2025-04-13 23:40:02 333

原创 第3个小脚本:批量下载某网站的所有英文内容到txt

根据该网站目录进行批量下载。

2025-04-13 13:49:12 97

原创 第2个小脚本:批量读取所有英文txt文章内容提取高频的单词

如何把网站的英文文章内容下载到txt文件,请看第3个小脚本:批量下载某网站的所有英文内容到txt。

2025-04-13 13:41:58 178

原创 记录问题:如何理解function calling

它允许模型在生成文本回复时,识别用户请求中的潜在操作需求,并触发预定义的函数(或工具)来执行具体任务(如查询天气、计算数据、调用数据库等),最后将结果整合到自然语言回复中。模型本身无法直接获取实时数据(如股票价格)、操作外部系统(如发送邮件)或执行复杂计算(如解方程)。"location": {"type": "string", "description": "城市名称"},"date": {"type": "string", "description": "日期"}模型分析请求,判断是否需要调用函数。

2025-04-13 09:19:01 277

原创 第1个小脚本:英语单语按字母个数进行升序排序

单词来源于coca单词库,按英语单语字母个数进行排序。

2025-04-12 16:08:39 590

原创 使用faster-whisper音频转asr字幕(亲测可行)

重点说明,下载模型时需科学上网或者用国内huggingface镜像网站下载。

2025-04-11 23:12:29 648

原创 问题:如何使用A i识别广告文章?建立去广告搜索?

首先,用户可能希望具体的步骤和技术工具,比如机器学习模型、自然语言处理,或者图像识别的API。需要详细说明技术实现的方法,比如文本分类模型、使用预训练的模型如BERT,或者图像处理中的OCR和反向搜索。还要提到可能的挑战,比如模型的误判,需要结合规则或人工审核来提高准确性。可能用户还关心如何整合这些技术,形成一个工作流程,比如从文章提取文本和图片,分别用不同的模型处理,然后综合结果。通过AI技术和编程实现自动化检测文章内的软文广告或广告图片,可以结合自然语言处理(NLP)、计算机视觉(CV)和规则引擎。

2025-04-11 09:47:02 794

原创 批量统一图像色彩

之前的回答中提到了颜色匹配的方法,但可能需要更详细的步骤,特别是如何将参考图像的颜色特征应用到其他图像上。我需要仔细分析他的需求,可能之前的回答没有完全满足他的具体要求。总结下来,用户的需求是:使用代码或AI,将多张不同颜色的图片批量调整为参考图像的红蓝色调。用户可能有编程背景,或者希望集成到自己的系统中,所以需要提供具体的代码示例,比如Python的PIL库或OpenCV的方法。· 该算法通过 LAB颜色空间 分离图像的亮度(L)和颜色(A、B通道),保留目标图的亮度,将参考图的颜色分布迁移到目标图。

2025-04-11 09:10:31 857

原创 如何根据不同文字内容批量生产手写的图片,模拟真人写的笔记(待验证)

另外,有些用户可能希望每个字的连笔效果更真实,这时候可能需要用算法处理,比如Python的PyHandwriting库,或者基于深度学习的模型生成笔画。进阶的话,用户可能需要更真实的效果,这时候可能需要用GAN模型,比如CycleGAN或者StyleGAN,但这对技术要求较高,需要训练数据和模型调优。另外,如果用户有特定的手写样本,可能要用字体生成工具将样本转化为字体文件,比如使用Calligraphr,这样生成的字会更个性化。另外,批处理脚本的编写,可能需要遍历文本文件,逐一生成图片,并保存为不同名称。

2025-04-08 15:28:22 473

原创 批量将图片统一色调

【代码】批量将图片统一色调。

2025-04-06 17:08:41 135

原创 将图片透视

【代码】将图片透视。

2025-04-06 16:47:34 78

原创 雕虫小技之批量取消抖音关注

【代码】雕虫小技之批量取消关注。

2025-04-05 16:59:23 107

原创 音频,字幕合成为视频

【代码】音频,字幕合成为视频。

2025-03-27 22:26:46 107

原创 一张图是红蓝色,另外几张是其它各种颜色,利用代码或ai批量将各种颜色的图片调为红蓝色的色调

通过 JavaScript 脚本批量调用 Photoshop 的「颜色匹配」功能:1. 将以下代码保存为 color_match.jsx:var reference = new File("reference_red_blue.jpg");var inputFolder = new Folder("input_images/");var outputFolder = new Folder("output_images/");var files = inputFolder.getFiles("*.jpg

2025-03-27 09:07:37 341

原创 模拟在一个段落自动换行和打字效果

const sampleText = "这是一个模拟自动换行和打字效果的示例文本。\n我们可以在这里添加多行内容,比如:\n1. 第一项内容\n2. 第二项内容\n3. 第三项内容...";// 容器宽度 - padding。// 示例文本(包含换行符)

2025-03-27 08:52:56 320

原创 头条博主文章二改去AI味的提示词工程底层逻辑剖析

作为头条博主,想要提升二创内容的原创性并规避AI检测,关键在于让内容具备“人味”和“深度个性化”。

2025-03-22 23:06:35 381

原创 跳动的霓虹灯字片头

【代码】跳动的霓虹灯字片头。

2025-03-04 20:49:32 108

原创 图片切片效果

【代码】图片切片效果。

2025-02-16 00:16:27 947

原创 流体粒子效果

【代码】流体粒子效果。

2025-02-16 00:02:12 240

原创 液态背景effect

【代码】液态背景effect。

2025-02-15 23:43:20 271

原创 动画逻辑逐字处理每个 <span> 的模糊和淡入效果

【代码】动画逻辑逐字处理每个 <span> 的模糊和淡入效果。

2025-02-15 23:16:26 139

原创 烟雾跟随鼠标效果

【代码】烟雾跟随鼠标效果。

2025-02-15 17:33:01 212

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除