Fooocus离线开源的AI文生图工具

Fooocus离线开源的AI文生图工具

Fooocus 是一款基于 Gradio 实现的图像生成软件,提供高质量的文本生成图像功能,完全离线、开源、免费。

github地址:https://github.com/lllyasviel/Fooocus
该项目已有37.4k star

在这里插入图片描述
Fooocus 具有以下特点:

  • 离线使用:Fooocus 可以离线使用,不需要连接互联网,这使得用户可以在任何时间、任何地点使用它,而不受网络限制。
  • 开源免费:Fooocus 是开源的,这意味着用户可以自由地使用、修改和分发它。同时,它也是免费的,用户不需要支付任何费用即可使用。
  • 操作简单:Fooocus 提供了直观易懂的界面,用户无需手动调整参数,只需关注提示词和图像,即可生成高质量的图片。
  • 集成优化:Fooocus 集成并自动化了许多内部优化和质量改进,用户可以忘记所有困难的技术参数,只享受人与计算机之间的交互。

Fooocus 重新思考了 Stable Diffusion 和 Midjourney 的设计,自动化了许多内部优化和质量改进。用户只需专注于文字提示和图像之间的交互,不需要去了解掌握那些困难的技术参数!

最重要的是,Fooocus 简化了安装,提供了一键安装包,无需繁杂的环境配置,就能实现“文生图”。此外,不吃配置,只需要 4G 显存即可使用!

下面是在一台具有 16GB 系统 RAM 和 6GB VRAM 的相对低端笔记本电脑(Nvidia 3060 笔记本电脑)上进行的测试,这台机器上的速度约为每次迭代 1.35 秒
在这里插入图片描述

windows环境下载安装Fooocus

1、在 GitHub 项目中直接点击下载链接进行下载
在这里插入图片描述
2、下载解压后,双击运行 run.bat 文件
在这里插入图片描述
3、第一次启动时,Fooocus 会自动下载模型,需要等待一定时间(如果已有模型文件,可以将它们复制到路径 .\Fooocus\models\checkpoints\,启动就会更快捷)
在这里插入图片描述
在这里插入图片描述
4、模型下载完之后,就会自动打开绘图界面,浏览器访问

http://localhost:7865

linux环境下载安装Fooocus

1、克隆代码

git clone https://github.com/lllyasviel/Fooocus.git

2、切换到 Fooocus 目录并创建一个新的 conda 环境

cd Fooocus
conda env create -f environment.yaml

3、激活新创建的 conda 环境并安装所需的 Python 包

conda activate fooocus
pip install -r requirements_versions.txt

4、启动 Fooocus

python entry_with_update.py

软件使用

1、默认模式是简洁模式,只有一个输入框、生成图片区域和生成按钮
在这里插入图片描述
2、勾选 Advanced 会弹出高级设置的窗口,可以调整画面宽高比、风格、图像数量、种子值、反向提示词、模型、lora 权重比值、图像锐利程度等
在这里插入图片描述
3、直接在文本框内输入提示词,然后点击 Generate 按钮就可以生成图像了
在这里插入图片描述
4、生成好的图像会自动保存在根目录的 outputs 文件夹内
在这里插入图片描述

### 开源文本转片工具推荐 对于开源的文本生成像工具,可以考虑以下几种: #### 1. **text-to-image** 这是一个可以直接将字符串形式的文本转换为包含该文本的像的工具[^1]。 该项目托管于 GitCode 平台,提供了简单易用的功能接口,适合需要快速实现文字到片功能的应用场景。 - **项目地址**: https://gitcode.com/gh_mirrors/text/text-to-image - **特点**: - 支持多种字体样式配置。 - 可自定义背景颜色、分辨率等参数。 - 轻量级设计,易于集成至现有项目中。 ```python from text_to_image import TextToImageConverter converter = TextToImageConverter(font_path="path/to/font.ttf", background_color=(255, 255, 255)) image = converter.convert(text="Hello, world!", output_size=(800, 600), font_size=48) image.save("output.png") ``` --- #### 2. **Pillow (Python Imaging Library)** 虽然不是专门针对文本转片的任务开发的库,但 Python 的 Pillow 库是一个非常强大的像处理工具,支持通过编程方式绘制文本并保存为片文件[^4]。 - **安装方法**: `pip install pillow` - **代码示例**: ```python from PIL import Image, ImageDraw, ImageFont def create_text_image(text, font_path, size=(800, 600)): img = Image.new('RGB', size, color='white') draw = ImageDraw.Draw(img) # 加载字体 try: font = ImageFont.truetype(font_path, 48) except IOError: raise Exception(f"无法加载指定路径下的字体 {font_path}") # 计算文本位置 text_width, text_height = draw.textsize(text, font=font) position = ((img.width - text_width) / 2, (img.height - text_height) / 2) # 绘制文本 draw.text(position, text=text, fill='black', font=font) return img if __name__ == "__main__": image = create_text_image("你好,世界!", "path/to/some_font.ttf") image.save("hello_world.png") ``` --- #### 3. **Brat Rapid Annotation Tool** 尽管 Brat 主要用于自然语言处理中的实体标注任务,但它也提供了一个可视化的界面,允许用户在线编辑和渲染带有标签的文本内容,并将其导出为静态片。 - **在线体验**: http://weaver.nlplab.org/~brat/demo/latest/#/ - **适用范围**: 更加适用于学术研究和技术文档展示领域内的复杂结构化数据可视化需求。 --- ### 总结 如果目标仅仅是简单的文本转片操作,则可以选择像 **text-to-image** 这样的专用解决方案;而对于更复杂的定制化需求来说,利用通用形处理框架如 Pillow 或者结合特定用途平台比如 Brat 则会更加灵活高效。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ThinkPet

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值