Gemini 2.0 Flash图像生成使用指南(超详细),免费可用

作为去年就公布的原生图像功能,Gemini 2.0终于在上周上线了,而且效果真如演示所示:

一句话就能完成P图!

不夸张地说,替换一般只会简单P图的美工不在话下。

今天就来给大家分享一下Gemini 2.0 Flash如何生成图片和P图,免费可用,超详细指南(包括进阶使用方法)!


一、如何使用Gemini 2.0 Flash生成图像?

目前主要有两种策略: 1.在Google Al studio中使用; 2.接入Gemini API使用。

1. 通过Google AI Studio使用

  • 打开Google AI Studio网站,使用谷歌账号登录。

https://aistudio.google.com/

  • 生成图片

    • 在页面中,点击“Create prompt”。

    • 在“Model”下拉菜单中,选择“Gemini 2.0 Flash (lmage Generation)Experimental”。

    • 在prompt框中,输入想要生成的图片描述,点击开始就可以。

  • 编辑图片:一句话P图

    • 我们可以继续在prompt框中输入指令,对生成的图像进行编辑。比如,你可以让AI添加元素、修改颜色、改变风格等。

  • 也可以上传现有图像,然后输入你想要的修改,如“添加...”“换成...”“改变...”等。

  • 甚至能直接让它给你一个女朋友……的图片😂。

2.接入Gemini API使用

除了在Google AI Studio,目前通过接入Gemini 2.0 Flash的API也是可以进行使用的,不过需要一定的技术基础。

试了一下在chatbox或者cherry中其实都没法直接生图,所以不太适合普通用户。

具体可以看使用文档:

https://ai.google.dev/gemini-api/docs/image-generation


二、进阶使用方法

1. 指明要编辑的主体,主体和需求动作分开

尤其是画面元素很多的图片,比如:

换成蓝色,不如“把这辆车的颜色,换成蓝色”。

2. 图文结合,直接生成系列图片

比如:

让它讲一个故事,并生成相应的配图,用这个方法可以直接制作儿童绘本!

3. 使用英文提示词,增加抽卡次数

虽然Gemini 2.0 flash生图的一致性确实很强,但是不一定每次生成都能符合需求。

这时候可以把提示词转成英文,或者重新编辑原来的提示词,继续发送来抽卡,直到找到满意的。

最后,Google AI Studio虽然提供了免费使用的额度,但是有使用限制的,具体如下:

目前每天最多50次请求,但每分钟不超过2次,最大tokens不超过32,000(后续可能会有变化)。


三、Gemini 2.0的使用方法

其实除其实除了原生图像功能这个重磅发布之外,Gemini还放出了很多更新。

比如Deep Research和Flash Thinking模型都已经上线到Gemini官网,目前深度研究功能每天限5次。

而且目前白嫖一个月会员的福利还是有的,需要的看这篇文章:

Gemini 2.0国内使用指南(超详细)

内容概要:本文介绍了GPT-ImgEval,这是首个全面评估GPT-4o图像生成能力的基准测试工具。GPT-4o是OpenAI最新发布的多模态大模型,在图像生成、编辑和视觉语言推理方面表现出色。GPT-ImgEval从三个关键维度评估GPT-4o:生成质量(通过GenEval数据集)、编辑熟练度(通过Reason-Edit数据集)以及基于世界知识的语义合成(通过WISE数据集)。研究发现,GPT-4o在这些任务上显著超越了现有方法,展示了强大的生成控制能力和输出质量。此外,文章还探讨了GPT-4o可能采用的底层架构,提出了基于分类模型的方法来区分自回归和扩散解码器,并推测其内部使用了扩散头进行图像解码。研究还揭示了GPT-4o在生成过程中的一些局限性,如尺寸不一致、高分辨率和过度细化的限制、复杂场景处理困难等。最后,文章对比了GPT-4o与Gemini 2.0 Flash在多轮图像编辑方面的表现,并讨论了GPT-4o生成图像的安全性和可检测性。 适合人群:对图像生成技术感兴趣的科研人员、开发者和工程师。 使用场景及目标:①评估和比较不同图像生成模型的性能;②深入理解GPT-4o的内部架构及其优缺点;③为未来的研究提供可靠的基准测试工具和方法。 其他说明:GPT-ImgEval提供了详细的定量和定性评估结果,帮助研究人员更好地理解和改进图像生成技术。此外,作者还开源了用于评估GPT-4o的自动化脚本和数据集,以便社区进一步研究和应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值