雾岛心情
微软最有价值专家、微软公共论坛版主、最有价值售前专家、Teched 讲师 先后为华硕、台积电、纬创、冠捷、友达、TPK 等等企业提供顾问咨询服务及培训服务,先后就职于Acer企业服务部、微软中国有限公司。现为企业提供BI+AI数据转型及咨询服务!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【AIGC专栏】Heygen 数字人方案
Heygen是目前最可靠的数字人制作平台,支持多种登录方式(谷歌、Facebook、邮箱)。平台提供丰富的数字人创作功能,包括视频、文案、声音等,但其他功能有待完善。用户可选择现有数字人或图片生成数字人,并进行编辑和面部替换。视频制作需提交文本或音频,生成需消耗点数。整体操作便捷,生成效果逼真。原创 2025-10-05 01:00:00 · 5 阅读 · 0 评论 -
【AIGC专栏】DID数字人播报方案
DID数字人交互方案提供便捷的虚拟播报功能,支持四种账户登录方式。用户可在简洁的工作台中创建数字人视频,通过内容生成区输入脚本或使用AI自动生成,并选择语言和风格(付费功能)。创建过程包括试听、扣除点数生成视频,最后可下载成品。系统将播报内容制作流程模块化,简化了数字人视频创作过程。原创 2025-10-02 00:30:00 · 153 阅读 · 0 评论 -
【AIGC专栏】DomoAI 文字转视频方案
DOMOAI是一款基于Discord平台的创意视频生成工具,通过聊天机器人实现多种内容转换功能。目前提供视频转动画(/video)、文生图(/gen)、动画转现实(/real)和图像转视频(/animate)四种创作模式。新用户可获得45点免费额度。测试显示其文生图效果出色,但图像转视频功能较差且不支持提示词。视频风格转换耗时较长,默认生成5秒动画片段。所有操作都需在Discord中完成,暂未推出独立网页版。原创 2025-09-30 00:45:00 · 160 阅读 · 0 评论 -
【AIGC专栏】PIKA LABS视频生成方案
PikaLabs是一家专注于AI视频生成技术的初创公司,仅由4人团队开发。该平台提供三种视频生成方式:文字生成视频、图片生成视频和视频重生成。目前仅支持Discord登录,用户可通过调整提示词和参数来自定义视频内容。生成结果保存在MyLibrary中,支持预览、修改、延长时长(4秒)等二次创作功能。平台还能结合文字转语音技术生成带音频的动画,并支持用户上传素材进行分享。原创 2025-09-28 00:45:00 · 30 阅读 · 0 评论 -
【AIGC专栏】StableVideo 的SAAS 视频生成方案
StabalityVideo是一个云端AI视频生成平台,支持文字转视频和图片转视频两种模式。用户可使用谷歌账号或邮箱注册,获得150点测试额度。操作流程为:输入提示词生成首帧图片(消耗11点)→选择风格→设置运镜方式→生成3-5秒短视频。目前视频效果尚可,未来版本值得期待。平台适合快速制作简单视频内容。原创 2025-09-25 00:45:00 · 114 阅读 · 0 评论 -
【AIGC专栏】Runway视频生成方案实现文字和图片转视频效果
Runway视频生成方案是AI驱动的文字/图片转视频工具,提供多种注册方式(邮箱、谷歌、Apple ID)。核心功能包括:1)支持文字或图文混合生成视频;2)内置在线视频剪辑功能;3)提供四种运镜参数调节(水平/垂直移动、旋转、缩放);4)MotionBrush功能可标记特定对象实现定向运动(含三种运动参数)。目前单次生成视频上限为4秒,多场景需分次制作。该方案实现了从静态内容到动态视频的AI转化,适合快速视频创作需求。原创 2025-09-23 00:45:00 · 25 阅读 · 0 评论 -
【AIGC专栏】Genmo 文字转视频平台
Genmo是一款操作简单的AI生成平台,支持谷歌和Discord账户登录。主要功能包括:基于提示词生成视频/GIF动画,提供比例、时长、循环等基础设定;内置Camera功能实现画面缩放;支持多种风格选择;可上传图片作为动画首帧,并添加过渡动画和自定义参数。平台界面直观,简化了内容生成流程。原创 2025-09-21 00:45:00 · 112 阅读 · 0 评论 -
【AIGC专栏】Kaiber的动画生成方案
Kaiber视频生成工具提供7天免费试用,需绑定双币信用卡注册。平台默认赠送100点使用额度,支持三种动画创作类型,用户可通过输入提示词和选择风格生成内容,每次生成消耗8个点数。系统会首先生成4个预览选项,用户选定后即可输出MP4格式的最终视频文件。原创 2025-09-18 00:45:00 · 151 阅读 · 0 评论 -
【AIGC专栏】Leiapix 动画生成方案
Leiapix是一个2D转3D的在线平台,支持将JPG/PNG图片转换为伪3D动画效果。该平台提供两种登录方式:谷歌账户和普通邮箱账户。用户上传图片后可自定义转换参数,实时预览3D效果并调整设置。转换过程简单直观,适合快速实现图片3D化处理。原创 2025-09-16 00:30:00 · 31 阅读 · 0 评论 -
【AIGC专栏】Fliki AI 视频内容生成方案
FlikiAI是一款文字驱动的AI视频生成工具,提供四种主要的内容创建方式。用户可通过关键词从内容库提取或AI自动生成媒体内容,包括AI形象和声音效果。系统支持自定义提示词和效果选择,自动完成视频生成流程。该平台提供多种登录方式,默认界面显示历史创作记录,适用于快速制作AI视频内容。原创 2025-09-13 01:00:00 · 29 阅读 · 0 评论 -
【AIGC专栏】SO-VITS-SVC 语音克隆方案
本文介绍了使用SO-VITS-SVC方案克隆个人声音的详细步骤:首先通过UVR5分离人声和伴奏,然后使用Slicer工具将音频切片(不超过10秒),注意需使用英文和数字命名。接着在SO-VITS-SVC中配置训练参数,选择默认编码器,预处理数据后开始长时间训练。训练过程中可通过TensorBoard验证效果,最终选择步数最多的模型进行加载。文中还提供了相关资源链接和注意事项,强调音频格式规范对识别的重要性。原创 2025-09-11 01:00:00 · 477 阅读 · 0 评论 -
【AIGC专栏】UVR 开源人声音乐分离方案
UVR5是一款开源免费的人声消除工具,可在Github下载1.5GB的本地版本。该工具操作界面简单,只需选择几个参数即可完成音频分离,支持多种输入格式和媒体类型。设置选项包括GPU转码、伴奏/人声分离以及采样模式等功能。原创 2025-09-09 00:45:00 · 410 阅读 · 0 评论 -
【AIGC专栏】Murf AI 文字语音互转方案
MURFAI是一款提供接近真人语音生成方案的AI平台,支持多种登录方式。用户可在SpeechStudio中管理内容,通过选择朗读者、语气、音调等参数创建语音项目,重点在于调整态度和停顿时间。平台支持文件导入,集成各类媒体内容,并可将上传的音频/视频文件声音替换为其他声音(需Pro版本)。原创 2025-09-07 00:45:00 · 43 阅读 · 0 评论 -
【AIGC】云端提取音乐乐轨方案
LALALA AI是一款专业的音频分离工具,能够精准提取音乐中的各类声音元素。该方案支持分离人声、伴奏、鼓点、贝斯等不同音轨,满足用户对音乐处理的各种需求。无论是提取明星歌曲的纯伴奏,还是分离特定乐器音轨,都能轻松实现。这款AI工具为音乐制作、二次创作等场景提供了便捷的音频处理解决方案。原创 2025-09-04 00:45:00 · 123 阅读 · 0 评论 -
【AIGC专栏】Azure文字转语音方案
Azure语音服务提供语音与文本互转功能,免费版包含5小时语音转文本和5小时文本转语音额度。该服务通过Speech-Studio的playground环境简化操作,无需编程即可实现文本转语音等功能,满足日常配音需求,功能强大且使用便捷。原创 2025-09-02 00:45:00 · 552 阅读 · 0 评论 -
【AIGC专栏】利用Azure的语音转文本方案进行文字提取
Azure认知服务中的语音服务支持文字与语音互转功能,用户可创建免费账户调用API。免费版提供5小时语音转文本和文本转语音额度,性价比较高。通过SpeechStudio平台可直接调用语音转文字服务,实现便捷的语音处理功能。原创 2025-08-31 01:00:00 · 130 阅读 · 0 评论 -
【AIGC专栏】AI的语音转文字方案Whisper
OpenAI开源的Whisper语音转文字工具缺乏可视化界面,开发者Const-me和chidiwilliams分别推出了带界面的GPU和CPU版本(Buzz)。使用前需下载基础模型文件,GPU版本需加载Bin模型并选择GPU加速,但核显效率较低。Buzz支持视频文件转换,可选择输出文本或SRT格式,CPU操作更简单但速度较慢。两款工具都实现了零开发门槛的语音转文字功能。原创 2025-08-27 01:00:00 · 634 阅读 · 0 评论 -
【AIGC专栏】通义万象生产图片内容
通义万相提供专业的图像生成与编辑功能,支持50点/天的文生图操作,可选择风格并复用图片生成相似图像。系统支持基于现有图片进行主体和颜色的微调,还能实现两张图片间的风格迁移。每日生成点数会在24点重置,操作流程包括选择风格、文字输入生成,以及通过"复用图片"功能进行二次创作。相比文心一言,该工具更专注于图像处理的精细调整功能。原创 2025-08-25 00:45:00 · 335 阅读 · 0 评论 -
【AIGC专栏】文新一言生产图片内容
文心一言是百度推出的个人AI助手,集成百度账户体系,具备文案写作、图片生成和文件处理功能。相较于MidJourney,其功能较为单一,无法基于历史图片二次创作,仅能重新生成。虽然提供多种图片生成插件,但在文生图的细节处理上仍有不足。原创 2025-08-21 01:00:00 · 56 阅读 · 0 评论 -
【AIGC专栏】Canva 图片设计的AI功能
Canva是一款在线图形设计工具,提供网页版和移动应用,支持拖放操作和丰富的模板素材,适合非专业用户快速制作专业设计。其国际版支持谷歌/Facebook登录,国内版则适配微信登录。平台内置AI功能如"魔力快写"可基于关键词生成文档内容,还支持文字转图片功能(需输入提示词、选择分辨率及风格)。高级图片修改和第三方AI工具集成(如DID)为付费功能。两个版本主要区别在于登录方式和AI功能支持。原创 2025-08-19 01:00:00 · 510 阅读 · 0 评论 -
【AIGC专栏】利用PlayGround平台进行文生图效果
PlaygroundAI是一个类似LeonaldAI的免费图片生成平台(每日500张)。其简化界面包含图片浏览、搜索、评级和创建四大功能区。用户可通过提示词或内容生成两种方式创作图片,参数包括提示词、模型选择、质量设置等8项要素。平台支持图片细节修改(如添加项链)并提供画布功能,支持图生图、分辨率调整等高级选项。图片评级功能有助于提升生成准确性,用户只需根据统一提示词评估内容匹配度即可。原创 2025-08-14 01:00:00 · 257 阅读 · 0 评论 -
【AIGC专栏】Leonald.AI实现图片生成
LeonaldAI是一款类似MidJourney的AI图片生成平台,提供150点/天的免费额度及多种付费服务。平台支持多种生成模式,包括图片生成、实时画布编辑、材质生成等功能,并能根据用户上传内容学习生成个性化风格。核心功能包括PromptMagicV3提示增强、AlchemyRefiner高保真模型、PhotoReal写实照片生成等,支持景深控制、原生模式等参数调节。生成后的图片可进行去背景、局部重绘等编辑,图生图功能支持自定义内容生成。为保持图片风格一致性,建议使用固定角色命名、重复提示词和Seed参数原创 2025-08-12 01:00:00 · 632 阅读 · 0 评论 -
【AIGC专栏】SD WebUI 应用IPadapter进行图片效果迁移
IPAdapter是StableDiffusionControlNet中实现图像风格迁移的关键组件。本文介绍如何使用IPAdapter结合动漫基底模型和Lora模型(下载地址提供)进行卡通风格转换,并以作者个人照片转换为卡通头像为例,展示了通过Agent实现的优质风格迁移效果。操作步骤包括下载IPAdapter模型并放置到指定目录,配合动漫基底模型使用,最终生成效果良好的卡通风格图像。原创 2025-08-10 03:30:00 · 118 阅读 · 0 评论 -
【AIGC专栏】Stable Diffusion的WEBUI中的OneButtonPrompts 自定义节点
本文介绍在StableDiffusion中使用OneButtonPrompt插件简化提示词生成过程。通过安装插件并重启界面后,用户可快速设置人像风格(如女性肖像)等参数,相比手动输入更便捷。文中演示了如何选择艺术风格、性别等选项,并支持在生成的提示词基础上添加自定义内容以增强效果。最后通过预览功能查看生成的提示词是否符合预期。原创 2025-08-08 02:45:00 · 120 阅读 · 0 评论 -
【AIGC专栏】实现WEBUI的艺术化二维码的创建
本文介绍了使用StableDiffusion生成艺术化二维码的方法。首先需要安装二维码组件并重启软件,然后通过设置两个ControlNet参数:QRCodeMonster(权重1.2+)和BrightNess(权重0.3左右),分别控制不同阶段的生成效果。同时可以利用图生图功能反推提示词,或直接使用文生图功能生成二维码图像。该方法可将普通二维码转化为具有艺术效果的图像。原创 2025-08-06 03:30:00 · 619 阅读 · 0 评论 -
【AIGC专栏】WebUI使用ADetailer进行人脸和手部修复
本文介绍了使用Stablediffusion生成多人照片时常见的问题及解决方法。作者指出默认生成的图片容易出现脸部崩坏效果,通过添加特定关键词可改善脸部生成质量。虽然脸部问题得到解决,但手部仍存在异常。文中建议使用第二个页签功能来修复手部问题,并鼓励读者自行尝试这部分修复操作。文章基于秋叶绘世版本,支持网页端加载安装。原创 2025-08-04 03:15:00 · 630 阅读 · 0 评论 -
【AIGC专栏】WEBUI 将图片背景移除组件RemBG
本文介绍了一款实用的图片背景消除插件,提供了详细的安装和使用指南。插件支持多种预训练模型,包括通用模型u2net、轻量版u2netp、人像专用u2net_human_seg等7种不同用途的模型。文章重点讲解了三个关键优化参数(ErodeSize、ForeGroundThrehold和BackGroundThrehold)的设置方法及其对处理效果的影响,并给出了推荐参数值。最后还介绍了如何获取蒙版输出而非图片结果的选项设置。原创 2025-08-02 01:00:00 · 272 阅读 · 0 评论 -
【AIGC专栏】Stable Diffusion的WEBUI 实现高清化
本文介绍两种图片高清修复方法:GFPGan适用于去除噪点和面部清晰化处理,能保持原有面部特征;CoderFormer则更适合图片放大处理。实验表明,结合两种算法的混合模式能显著提升放大效果,满足高清化需求。GFPGan侧重修复,CoderFormer侧重放大,用户可根据具体需求选择不同处理方式或组合使用以获得最佳效果。原创 2025-07-31 04:45:00 · 138 阅读 · 0 评论 -
【AIGC专栏】WEBUI的StableSR 实现图片放大
StableSR安装需完成四个步骤:1.通过GitHub安装插件;2.从Huggingface下载SD2-1检查点文件;3.下载StableSR专用模型并放入指定目录;4.安装TiledDiffusion和VAE扩展。使用时需切换至SD2-1模型,在脚本中选择StableSR功能。最终处理效果优于4xUltraSharp,但仅支持V2-1模型。(148字)原创 2025-07-30 01:00:00 · 786 阅读 · 0 评论 -
【AIGC专栏】WebUI实现图片的缩放
本文介绍了多种图像缩放模型及其特点。Lanczos和最近邻插值属于传统方法,前者精确但计算复杂,后者简单但效果粗糙。深度学习方法包括BSRGAN、ESRGAN及其变体(如R-ESRGAN4x+)、SwinIR等,能生成高质量放大图像但资源消耗大。4x-UltraSharp是一种集成在后期处理工具中的实用算法,支持单张或批量图片的4倍放大。不同模型适用于不同场景,用户可根据需求在速度、质量和资源消耗之间权衡选择。原创 2025-07-28 01:15:00 · 1232 阅读 · 0 评论 -
【AIGC专栏】StableDiffusion基于WebUI 实现批量操作
StableDiffusion支持批量文件夹操作,输入目录选择待处理文件,输出目录需为空。ControlNet可在特定条件下进行批量重绘,需设置蒙版目录。操作时需注意:禁止使用中文路径,输出目录必须为空以保存生成内容。该功能依据提示词自动生成所需内容,简化了批量处理流程。原创 2025-07-25 01:45:00 · 141 阅读 · 0 评论 -
【AIGC专栏】Stable Diffusion的WEBUI 上传蒙版以及批量操作
WebUI支持通过上传蒙版实现图片编辑,其中白色区域为可修改部分,黑色区域将保持不变。用户可反转蒙版来切换编辑区域(如将背景设为可修改)。操作过程中提供多种参数设置,可灵活调整蒙版效果以满足不同编辑需求。该功能能精准控制图片的修改范围,适用于局部内容调整。原创 2025-07-23 02:45:00 · 208 阅读 · 0 评论 -
【AIGC专栏】Stable Diffusion的涂鸦重绘
涂鸦重绘技术结合了涂鸦和局部绘制功能,通过蒙版实现图片多对象修改。蒙版透明度影响效果:透明度越低效果越好,越高则越弱。涂鸦绘制无蒙版,笔刷颜色决定对象颜色,可多色操作改变整图;局部重绘通过蒙版定义对象,将笔刷颜色视为单一类型;涂鸦重绘兼具两者特点,使用蒙版且笔刷颜色决定对象,支持多色操作。该技术为图片编辑提供了灵活的对象修改方案。原创 2025-07-17 03:15:00 · 150 阅读 · 0 评论 -
【AIGC专栏】Stable Diffusion的涂鸦和局部绘制功能
本文介绍了StableDiffusion图生图中的局部重绘功能,主要涉及蒙版参数设置:1)蒙版边缘模糊度控制边缘清晰度;2)蒙版模式选择重绘区域;3)蒙版内容处理决定图像变化程度;4)区域处理模式包括填充、原版等四种方式,影响重绘细节和创意空间。此外还建议蒙版边缘预留30像素以上,避免边缘干扰。这些参数设置直接影响局部重绘的效果和精度。原创 2025-07-14 03:30:00 · 769 阅读 · 0 评论 -
【AIGC专栏】Stable Diffusion实现基于图片描述
WebUI提供两种词语反推模式:Clip和DeepBru神经网络。Clip基于跨模态对比学习,适用于通用场景,生成多样且语义丰富的描述词;DeepBru采用端到端训练,针对专业领域提供更精准的描述。Clip优势在于通用性,DeepBru专精于特定领域准确性。两种方法各有侧重,可根据需求选择或结合使用,Clip适合宽泛场景,DeepBrou更适合专业应用。原创 2025-07-09 01:15:00 · 256 阅读 · 0 评论 -
【AIGC专栏】StableDiffusion实现WebUI的图生图
StableDiffusion图生图功能使用指南:通过页签切换至图生图界面后,可上传底图并输入正向/反向提示词。支持调整图片大小、裁剪及空白填充功能。关键参数包括重绘强度(0-1,值越小越接近原图)和提示词引导系数(最大30,影响画面程度)。重绘幅度(最大1)决定画面变化程度,数值越高差异越大。操作时需注意这些参数的合理设置以获得理想效果。原创 2025-07-07 01:15:00 · 508 阅读 · 0 评论 -
【AIGC专栏】StableDiffusion 引用脚本功能
StableDiffusion进阶操作指南:通过矩阵脚本实现多样化图片生成。支持提示词变量管理,可自定义不同参数组合(如变量1|变量2)。使用Prompts功能满足特定需求,X/Y/ZPlot对比不同采样结果。适用于多参数测试与效果对比,最终生成可视化采样矩阵。原创 2025-07-04 02:45:00 · 340 阅读 · 0 评论 -
【AIGC专栏】WEBUI的EasyPhoto的组件
EasyPhoto是一款基于稳定扩散算法的图像处理工具,可通过AI模型训练实现人像美化与风格迁移。安装后通过WebUI界面操作,支持选择5-20张图片作为训练素材,可自定义Lora模型类型、训练步数等参数。完成训练后可将生成模型应用于不同场景图像,实现自然的人物面部替换效果。项目开源地址为GitHub的sd-webui-EasyPhoto,适合需要快速优化照片质量的用户使用。原创 2025-06-30 01:15:00 · 1180 阅读 · 0 评论 -
【AIGC专栏】WebUI的ControlNet具体应用
ControlNet参数设置详解:1)权重控制(默认1)决定其对生成图片的影响程度;2)介入/终止时机通过采样步数乘积调节控制强度;3)控制模式分为均衡、偏提示词或偏ControlNet三种;4)缩放模式管理图片尺寸处理。启用多个ControlNet时需协调各权重比例,建议开启预览和完美像素模式验证效果。具体应用中可调整介入时间与结束时间来控制图片与原图的差异度,同时选择匹配的预处理器和模型。注意多ControlNet组合使用时,权重配置将直接影响最终图片风格的呈现效果。原创 2025-06-26 02:45:00 · 134 阅读 · 0 评论 -
【AIGC专栏】StableDiffusion的ControlNet模型
openpose有6个预处理器,一openpose , openpose face姿态和脸部,openpose faceonly仅脸部,openpose full姿态手部 脸部,openpose hand手部。一般用于建筑室内,室内结构和场景的绘制,在结构化的场景中,我们可以依据这些场景的定义生成相应的建筑设计,它可以实现当前结构中的直线条或者轮廓线等等。软边缘与canny差不多,相比Canny,他会生成大的轮廓线,也会生成小的轮廓线,差别在于生成过程中先生成大的轮廓线再来细节部分。原创 2025-06-24 02:45:00 · 307 阅读 · 0 评论