自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(287)
  • 收藏
  • 关注

原创 v0.dev 提示词泄露

昨天 v0.dev 的 chat 功能正式发布,能力非常的强,今天它的提示就泄露了。用到了很多提示工程中的技巧。

2024-08-23 10:21:19 215

原创 全球百大 AI 排行榜

由 @a16z 基于 Sensor Tower 和 Similarweb 数据整理的。上面得网站都可以在三花导航上找到对应站点,这里就不一一列出了。,分为如图所示两个榜单。

2024-08-23 10:19:10 174

原创 大模型竞技场 Chatbot Arena 新域名全国可用

LMSYS Chatbot Arena 相信大家都很熟悉,业内最知名的大模型竞技场,你可以在这里找到不同语言、不同领域下最适合的模型,他们的排行榜也经常被各大 AI 自媒体所引用,包括三花~我测试了一下,全国可用,访问速度非常快!

2024-08-23 10:17:46 223

原创 谷歌 Prompt gallery 官方提示词库

目前提供了 26 个不同的类型的创意提示词。之前介绍过 Claude 官方推出的。

2024-08-23 10:13:27 331

原创 公开二次元模型权重

我们都知道 2022 年时的 NovelAI 开启了 AI 绘画热潮,同年 10 月初,其模型泄露,市面上涌现了大量二次元 AI 绘图网站。模型还是只能在其官网上用。

2024-08-23 10:11:43 102

原创 一站式 AI 影视解说+自动化剪辑工具

是一个自动化视频解说和编辑工具,支持一站式剧本创作、自动视频编辑、配音和字幕生成。

2024-08-23 10:08:04 96

原创 开源视频模型 CogVideo 现已支持 VEnhancer

之前介绍过,一个开源的用于增强 AI 视频分辨率和质量的技术,效果非常不错。上面视频可以看出,不仅分辨率更高,帧数也更丝滑。

2024-08-22 13:30:21 106

原创 第一个 Flux IpAdapter 模型开源

暂时生成的效果还没有 SDXL 和 SD1.5 的好,著名 ComfyUI 插件作者 cubiq 称似乎有抢第一的嫌疑,期待更好的和更优的版本。IpAdapter 我们都很熟悉,可以轻松完成风格迁移,还是来自 XLabs-AI,他们发布了。

2024-08-22 13:26:48 216

原创 Ideogram 2.0 现已免费推出

文本生成能力 Ideogram 一直就很领先,官方还表示,其质量表现已经超越 Flux Pro 和 DALL·E 3。不要错过了,大伙快去试试。文生图模型,可以每天免费生成 40 张图片,还面向开发者推出了 API 服务。

2024-08-22 13:25:23 201

原创 Midjourney Web 现已免费开放

官方推出了一个在线编辑器视频,演示了其 Web 版本的一些能力,现在已向所有人开放,由于还是早期阶段,暂时还是免费的,主要特性如下。

2024-08-22 13:21:36 313

原创 免费开源背景删除大集合

有大佬整理了 HF 上所有好用的一键背景删除 Space,,有需求的不要错过。

2024-08-22 13:09:56 216

原创 前端又要被替代了 v0.dev 全新升级

现在迎来了大更新,就像 Claude Artifact 一样,支持了对话生成前端界面了,背后的知识库都升级到最新版本。视频演示的是使用 v0 chat 生成的俄罗斯方块游戏,即使你不懂代码也推荐你试试,非常的强。如果你是一个前端开发,那么 vercel 家 的。你一定知道,俺还是早期测试人员哩。

2024-08-22 13:07:58 214

原创 在 M 系芯片的 Mac 上运行 Flux

在 0.3.0 支持了 FLUX.1-schnell 模型,刚刚更新的 0.3.1 主要时改进了性能,比之前快了 30%。schnell 是 4 step 模型,所以这个速度还是挺慢的,有比没有强。

2024-08-21 16:43:13 465

原创 FLUX64:老游戏 N64 和 PS1 风格

不过生成画面就像 Nintendo 64(1996 年) 和 PS1(1995 年)的游戏截图。作者表示,这个 LoRA 只用了 29 张图。

2024-08-21 16:40:47 203

原创 你有识别 AI 的火眼金睛吗

这个小工具提供了一个测试,你可以试试你对 AI 图片的敏感程度。随着 FLUX 的推出,现在 AI 生成的照片越来越难以分辨了,我判断是否为 AI 大概是下面这些方面,你们有啥更好的办法吗?如图,我测试下来错了一个,眼力还不够啊!

2024-08-21 16:38:59 155

原创 微软开源 Phi-3.5 视觉模型

微软刚刚发布了 Phi 3.5 系列模型,一个小型模型 ("Mini")、一个混合模型 ("MoE") 和一个视觉模型。最关键的是基于 MIT ,几乎是最宽松的开源协议了,微软大善人。这下除了 CloseAI,大家都是 OpenAI。

2024-08-21 16:37:18 378

原创 SpaRP:每日一个 3D 生成模型

主打图生 3D,关键点在于默认就支持上传多视角照片来控制最终结果,质量的话大差不差。不过话说回来,都有多视角了,还差 3D 模型吗。

2024-08-21 16:34:11 121

原创 FLUX PVC 开源手办绘画模型

有人训练了一个 FLUX.1 schnell 的 PVC 风格 LoRA,虽然效果肯定没 Dev 的好,但是这个是完全可以商用的!,非常多的朋友喜欢,我自己也把玩了好久。之前介绍过 SDXL 下的一个。

2024-08-21 16:31:57 243

原创 LumaAI DreamMachine v1.5 现已发布

说好的下周发布,结果刚刚发布了!

2024-08-20 15:25:12 206

原创 Open-LLM-VTuber:AI 驱动的 VTuber

作者还提供了一个 13 分钟的演示视频可以在原项目里看看,目前还处于非常早期阶段,等完善了可以预想到 B 站虚拟主播和弹幕互动区是什么样子了..是一个开源的集成了 Live2D AI 虚拟形象并支持语音聊天对话的项目。

2024-08-20 15:22:57 193

原创 Hotshot:4 人团队做的文生视频模型

是今年 3 月份发布的一个文生视频大模型,不过没有掀起什么水花,官方的宣传视频才只有 8 个赞。最近突然火了,每天能免费生成 2 次,生成的视频相当不错,值得一试。官方也正在招远程职位,介绍中表示他们是一个 4 人小团队,惊了。

2024-08-20 15:21:49 293

原创 FAI Fuzer:电商利器,一键生成背景

需要注意的是,这个 Space 背后的技术不是开源的,如果要自己接接口用的话免费的只有 20 次,之后每次需要 $0.08。是一个能为提供的产品或角色生成并融合背景的 Space,支持写实和动漫风格。只需上传一张照片,然后编写提示词,就能保持主体不变,自然融合到生成的背景当中。其实 ComfyUI 就能很容易实现这个效果,有空我整一个!

2024-08-20 11:03:46 444

原创 TurboEdit:基于文本的实时照片编辑

它和其他重绘技术比,最大的特点就是快,只需 8 Steps 预处理,然后每次修改只需 4 Steps,性能充足的情况下接近实时。是 Adobe 研究院发布的能够通过提示词实时编辑照片的技术。也就是又一个无需遮罩的局部重绘技术。目前官方只放出来演示视频、论文和项目主页,期待开源!

2024-08-20 11:00:56 143

原创 Flux 默认景深/背景模糊规避技巧

上面的方法不是银弹,实测下来要么速度变慢,要么质量降低,不过能有效解决背景模糊的问题,希望 Flux 官方能提供更好的解决方案。

2024-08-20 10:58:38 226

原创 ComfyUI 生态大更新

上次让我惊喜的 AI 视频还是那个手臂变色龙,今天这个作品来自大佬 @enigmatic_e,使用遮罩+形状层配配合 ComfyUI 生成视频,并用 Elevenlabs 完成配音,作者表示完整做完这个视频大概用了 3-6 个小时。ComfyUI RyanOnTheInside Node Pack 这个节点非常有意思,能够将粒子、光流、形变、脉冲、旋转、扭曲等特效作为 Mask 融入你的工作流中,可用于创作非常酷炫的 AI 视频。作者目前没有开源他的工作流,我会替你们持续关注~

2024-08-19 11:19:14 676

原创 Flux GGUF 和 NF4v2

模型,最小的 Q4_0 只有 6.79 GB 了,速度和资源要求很接近 nf4v2,但生成图的质量更好一些,同样需要一个自定义节点,版本了,除了比 v1 大了 0.5 G 外,质量和速度又提升了,如果想要在 ComfyUI 中使用,需要。要知道,Flux 社区目前最流行的就是 fp8 版本,因为它要求的资源不多还能生成不错的效果。,一种比 fp8 效率高质量好的新模型,就在昨天就更新到。5 天前,ControlNet 作者才发布了。

2024-08-16 10:07:01 567

原创 Generative Photomontage:生成式图片融合

示例图展示了 ControlNet 和 提示词输入,然后在生成过程中,用户可以在其描绘想要的部分或想要的构图,最后输出完美融合了用户选中的部分。专门用来解决这个问题,抽卡过程中,你可以使用画笔描出你觉得好的地方,然后这个技术会帮你把你选中的部分完美融合。很多时候我们通过文生图很难想象或者描述出想要的最终效果,往往伴随着大量抽卡,直到满意。

2024-08-16 10:04:51 407

原创 Runway Gen-3 Alpha Turbo:现已向所有人开放

的 Gen-3 Alpha Turbo 图生视频模型的生成速度比原来的 Gen-3 Alpha 快 7 倍,还便宜了一半,目前已经向所有人开放,包括白嫖用户。

2024-08-16 10:03:04 145

原创 AuraFlow:开源文生图扩散模型更新到 v0.3

之前介绍过,它是 fal.ai 开源一个生图扩散模型,最近更新了 v0.3 版本,该版本通过微调美学数据集,并支持更高分辨率,进一步提升了图像生成质量,比 v0.2 进步不少,但是比 FLUX 还是比不了一点。

2024-08-16 10:01:02 118

原创 马斯克:Grok-Flux 只是过渡,自研文生图即将推出

有网友提出 xAI 的 Grok 居然使用了 Flux 作为生图模型,要知道谷歌 ImageFX 内置了审核过滤, OpenAI 的 DALL-E 则卡通风格,而 Grok 似乎没有任何过滤,不怕法律或其他问题吗?马斯克直接表示,几个月后会推出自己的图像生成系统,现在用 Flux 就是让大家提前玩玩。

2024-08-16 09:58:39 384

原创 InstantX:通用 FLUX.1-dev ControlNet 模型

对,就是那个做 InstantId 的团队,他们训练了一个系列适用于 Flux.1-dev 的通用 ControlNet 模型。支持的模式有:canny、tile、depth、blur、pose、gray、lq。

2024-08-16 09:56:41 240

原创 xAI Grok-2: 现已在 上发布并集成了 FLUX.1

Grok-2 具备实时信息处理能力, Grok-2 mini 则速度更快。Premium 和 Premium+ 用户可以在 𝕏 上使用这两个模型。,还包含了一个 mini 型号,在推理、编程和对话能力上比 1.5 有显著提升,在。发文表示 FLUX.1 现在已经集成到 Grok-2 中了!竞技场上目前排名第三。

2024-08-15 17:06:41 539

原创 这么看 DeepSeek 真的良心!写缓存都不要钱!

(提示缓存)功能,目前还在测试阶段,需要手动开启,写入缓存比普通输入要贵 25%,但是命中缓存则价格便宜 90%,在长上下文或重复任务还是比较值的。(即使用 claude 生成的应用),可以直接用来计算使用 Prompt Caching 能给你省多少钱。之前的缓存功能,Anthropic 推出了“

2024-08-15 17:01:17 290

原创 OpenAI 教你使用提示词威胁 ChatGPT

网友 @testingcatalog 扒出了 ChatGPT Mac 客户端的一个测试提示词,主要用于让 ChatGPT 在需要查看屏幕的时候,强制输出 SHARE_YOUR_SCREEN_PLEASE 关键词,以便程序调用弹窗。如果你要求查看用户的屏幕而没有包含"SHARE_YOUR_SCREEN_PLEASE",那你就要被开除了!

2024-08-15 16:54:54 292

原创 谷歌 MadeByGoogle 省流总结

活动省流总结:

2024-08-15 16:52:52 170

原创 LongWriter:LLM 万字生成

的框架,能讲超长的生成任务分解为子任务,使现有的 LLMs 能连贯生成并输出超过 20000 个单词。是一个专门用于解决现有大模型很难一次输出超过 2000 字的项目。和 LongWrite-Ruler 基准测试。数据集和用于评估长文本生成性能的。

2024-08-15 16:49:43 220

原创 适用于 ComfyUI 的 ControlNeXt-SVD 节点

开源社区太顶了,昨天介绍的。

2024-08-15 16:46:39 110

原创 OpenAI 新模型 chatgpt-4o-latest 重回榜一

的模型,可以通过 API 调用了,并且在 LMSYS 竞技场中重回第一(此前是 Gemini 1.5 Pro Exp 0001)上周 OpenAI 打哑谜宣布了一个新模型,但是一直没说到底是啥也没解释更新了啥,今天 OpenAI 开发者官号宣布了名为。中的介绍说这是一个动态模型,会随着时间变化而更新改进,并且反复强调生产环境不要用这个模型。

2024-08-15 16:42:23 238

原创 FLUX ControlNet 合集

由 XLabs-AI 整理的。

2024-08-15 16:38:19 127

原创 谷歌 Gemini Live:安卓手机副驾驶

对标 ChatGPT 的语音模式,支持支持打断、深入讨论和暂停后继续对话,提供了 10 种不同的声音,未来会支持 IOS 设备和其他语言。顺带 Pixel9 也亮相了,使用 𝗚𝗼𝗼𝗴𝗹𝗲 𝗧𝗲𝗻𝘀𝗼𝗿 𝗚𝟰 芯片,内置 Gemini Nano, 并且 Gemini Live 会作为默认助手,死去的 Ok Google 回来了!,安卓手机副驾驶,拥有 Gemini Advanced 订阅的用户将灰度该功能,目前仅支持英语。直播演示时两次都失败了,肉眼可见主持人的尴尬,直到换了个手机重弄,笑死。

2024-08-14 09:53:32 263

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除