我把「FLUX」接入了「小爱」,微信直接出图,告别一切绘画软件!

前两天,搞了个微信 AI 小助理-小爱(AI),爸妈玩的不亦乐乎。

最近一直在迭代中,挖掘小爱的无限潜力:

有朋友问:小爱能 AI 绘画么?

小爱:害,不过是接个模型的事儿~ 扶我来战!

今日分享,继续带大家实操:如何让小爱理解用户需求,并生成满足需求的图片!

要实现AI 绘画功能,我们先来拆解下步骤:

  • 识别用户意图:从用户输入中识别出AI 绘画的意图;
  • 生成绘画提示词:根据用户输入,生成给绘画模型的提示词;
  • 生成图片:调用图片生成模型的接口,返回图片 url。

1. 识别用户意图

零风险!零费用!我把AI接入微信群,爸妈玩嗨了,附教程(下)的基础上,我们只需在意图列表中新增一条:图片生成

提示词如下:

intentions_list = ['天气', '步行规划', '骑行规划', '驾车规划', '公交规划', '地点推荐', '图片生成']
intentions_str = '、'.join(intentions_list)

sys_intention_rec = f'''
  你是意图识别专家,我会给你一句用户的聊天内容,帮我分析出他的意图。
  要求:
  1. 只有当你非常明确意图来自以下类别:{intentions_str},才能回答,否则请回复“其它”。
  2. 直接回答意图标签即可,无需回答其它任何内容。
  '''

这样,LLM 从用户输入中识别到图片生成后,就直接路由到指定的处理逻辑。

2. 生成绘画提示词

由于用户输入是非结构化,这就需要提取出和绘画提示词相关的内容。

不过,这事简单,直接交给 LLM 就行,你只需给它合适的角色提示词就行:

if intention == '图片生成':
    messages = [
        {'role': 'system', 'content': '根据用户输入,生成给stable diffusion等图片生成模型的提示词,只回答提示词内容,无需回答其它任何内容'},
        {'role': 'user', 'content': f'{user_content}'}
    ]
    res_prompt = unillm(['gemini-1.5-flash', 'glm4-9b'], messages=messages)

你别看就这么个简单任务,参数量小一点的模型压根搞不定!

实测下来,还是gemini-1.5-flash靠谱一些,推荐大家使用。

3. 生成图片

有了绘画提示词,终于到最后一步:生成图片了。

用啥模型生成图片呢?

本地部署个 Stable Diffusion

都 2024 了,AI 绘画的风口在 FLUX 这里,强烈推荐你去体验一下👉FLUX + LoRA 实测,AI 绘画开启新纪元,5分钟带你部署体验

现在 FLUX 的生态已经越来越完善了,但是本地部署对很多小白来说还是有点门槛。

为了让大家能快速跑通流程,我们选用siliconflow提供的免费接口。

核心代码如下,一键接入 AI 绘画模型:

def generate_image(prompt='a cat', model='flux', img_size='1024x576', batch_size=1):
    url = f"https://api.siliconflow.cn/v1/{model}/text-to-image"
    headers = {
        "accept": "application/json",
        "content-type": "application/json",
        "Authorization": "Bearer xxx"
    }
    data = {
        'prompt': prompt,
        'image_size': img_size,
        'batch_size': batch_size,
    }
    response = requests.post(url, json=data, headers=headers)
    img_urls = [img['url'] for img in response.json()['images']]
    return img_urls

当然,siliconflow也开放了Stable Diffusion系列模型,不过从实测来看,FLUX 更香,不知大家体验如何,欢迎评论区交流。

如果有更多AI绘画的定制化需求,只能本地部署 LoRA + ControlNet 模型。想咋玩,你说了算!

4. 效果展示

来一波测试案例:

在这里插入图片描述

最后,我们来看下日志:

意图识别没问题!

此外,gemini还会帮我把绘画提示词润色一下。这下,你还担心不会写提示词么?

写在最后

本文通过简单三步为小爱接入了AI 绘画能力。

从此,写公众号,再也不用费劲找封面图了,小爱直出,灵感无限!

大家有更好的想法,欢迎评论区交流。

如果本文对你有帮助,不妨点个免费的赞收藏备用。

想和小爱互动的小伙伴,可以通过公众号找到我,拉你进群体验。


为了方便大家交流,新建了一个 AI 交流群,欢迎感兴趣的小伙伴加入。

小爱也在群里,想进群体验的朋友,公众号后台「联系我」即可,拉你进群。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值