最新,新版GPT-4o生图功能太强了(附一些使用方式)

经过长达一年与人类训练师协作优化,OpenAI于美国当地时间周二发布了GPT-4o原生多模态图像生成功能,支持生成更加逼真的图像。这是 Deep Research 以来 OpenAI 最有意义的模型更新。 新模型+一句话指令,效果就超过了人类精心设计的工作流。 Al 在设计方面超过人类,已是必然。
 

用户只需在ChatGPT中描述图像(可指定宽高比、色号或透明度等参数),GPT-4o便能在一分钟内生成相应图像。让我们细致看一看:本次更新,突破了以往的哪些边界。
 

OpenAI在公告中确认,GPT-4o图像生成功能具有以下特点:
 

  • 精准渲染图像内文字,能够制作logo、菜单、邀请函和信息图等;
  • 精确执行复杂指令,甚至在细节丰富的构图中也能做到;
  • 基于先前的图像和文本进行扩展,确保多个交互之间的视觉一致性;
  • 支持各种艺术风格,从写实照片到插图等。
     

GPT-4o生成图片效果展示


除了通过GPT-4o可以在ChatGPT中直接生成图像,该模型还整合进了OpenAI的视频生成平台Sora,进一步扩展了其多模态能力。
 

新模型即日起将作为ChatGPT的默认图像生成引擎,向ChatGPT Free、Plus、Team及Pro用户开放,取代此前使用的DALL-E 3。企业版、教育版以及API接口也将在不久后支持该功能。
 

据OpenAI官方说明,GPT-4o在多个方面相较于过去的模型进行了改进:
 

  • 更好的文本集成:与过去那些难以生成清晰、恰当位置文字的AI模型不同,GPT-4o现在可以准确地将文字嵌入图像中;
  • 增强的上下文理解:GPT-4o通过利用聊天历史,允许用户在互动中不断细化图像,并保持多次生成之间的一致性;
  • 改进的多对象绑定:过去的模型在正确定位场景中的多个不同物体时存在困难,而GPT-4o现在可以一次处理多达10至20个物体;
  • 多样化风格适应:该模型可以生成或将图像转化为多种风格,支持从手绘草图到高清写实风格的转换。

让我们看看,目前4o生图可以做到的水平吧!

4o目前生图水平

1、一句话老照片上色

2.一句话修改图片

3.一句话做成鸟瞰图

4.一句话图标风格设计

5.一句话将原图改风格

6.一句话将图像转换样式

7.一句话融图创建新图像

8.一句话基于草图直接生成产品UI页面。

“你能基于这个UI创建一个高保真的产品模型吗?”。

9.一句话根据图片生成漫画

现阶段,GPT-4o取得了许多进步,但它仍然存在一些问题,其中包括:

  • 裁剪问题:像海报这样的较大图像可能会被过度裁剪;
     
  • 非拉丁字符的文本准确性:某些非英语字符可能无法正确呈现;
     
  • 小字体中的细节保留:小字号文本的细节可能会丢失或不够清晰;
     
  • 编辑精确度:修改图像的特定部分时,可能会意外影响其他元素。


OpenAI表示,正在通过持续的模型改进积极解决这些问题。

怎么才能用上最新版 GPT-4o?

目前,可以确定的渠道是付费的 OpenAI 的 Plus、Pro 和 Team 用户。

但是海外使用有点困难,所以整理了一些其他的方式,小伙伴们可以尝试使用,接触一下4o生图的功能。千言万语其实不如你自己实际体验一下,快来领会一下科技的魅力。

一些使用4o的方式

1、OpenAI官网

没错,如果有能力还是直接去官网使用,体验相当nice。

就是价格稍微贵,需要20美刀,不过这个价格打包市面上OpenAI对话模型、视频、图片、语音给你使用。我觉得也合理。毕竟免费才是最贵的。

使用地址:https://chatgpt.com/

2、爱发电

国内大佬主要做解决GPT4o和Claude使用的公益服务网站,但是最近因为项目经常被攻击,目前采用订阅方式使用,感兴趣的可以自己去了解。本来是公益的,现在限制了一下防止攻击,需要订阅了。


公益网址我这边没去赞助,没拿到喔,想了解自己去看看吧!
使用地址:https://afdian.com/a/warmo

3、工作区-Salck

大佬通过OpenAI官网的API在Slack配置的一个应用。
加入他的Slack工作区就能直接使用GPT-4o、Gemini模型。而且工作区里面还有Claude3.7系列模型可以使用。目前Slack可以在电脑、手机、网页使用,可以说是很方便了。


注意,加入工作区一般需要使用国际邮箱,用微软的outlook邮箱就好了。首次加入需特殊环境(需自行准备)。加入完进入工作区在频道@GPT4应用即可。
工作区加入链接:https://h5ma.cn/jxn



4、模型竞技场

进入竞技场后点击DIRCTChat,然后选择4o模型就好。

需要注意的是,模型竞技场有些时候会因为没有次数额度下架4o模型使用。你可以去试试看,如果没有的该模型选项的话,晚会再进去试试。

注:首次进入稍微卡,需要等待一会。

使用地址:https://h5ma.cn/lpi


5、Poe

一个海外AI模型聚合平台,提供各种各样的模型体验。市面上热门的Claude3.5、Claude3 Opus、GPT4o、Gemini基本都涵盖了。


但是限制次数,免费用户每天有3000积分,每日重置一次,对于4o模型来说,每次对话消耗200积分,也就是每天可以免费对话15次。尝个鲜还是不错的。当然次数用量大,可以换号薅~
使用地址:https://poe.com/

6、chatshare

国内最大的镜像站之一,主要提供OpenAI和Claude的镜像服务。目前账号充足,采用自购账号和API方式接入官网服务。运行时间长,可靠稳定。

注册后需使用激活码订阅,订阅完成即可使用。具体不多说,需要的可自行了解。

使用地址:chatshare.biz

激活码获取:https://h5ma.cn/chatjhm

7、 Sider插件

Sider是一款浏览器插件,你可以在Edge浏览器和Chrome浏览器中安装它。

接入ChatGPT官方提供的付费稳定版API,为用户提供无需科学上网、稳定快速的服务。目前支持GPT4、Claude3、Claude3.5-16k等等,可在国内使用。

可以帮助我们进行更正语法、改写内容、扩充内容和生成广告脚本。它支持在任何网站上使用,并提供摘要文章、解释代码等功能。

使用地址:https://sider.ai/invited?c=c72098f2510f255a812ffb1a4b8fe977


8、Aichatru

俄罗斯的一个网站,可以使用4o和o1模型,但是模型应该是有次数限制的,具体多少忘记了,各位小伙伴可以自己测试。如果次数受限,可以配合大神开发的油猴脚本突破这个使用限制。


使用地址:https://aichatru.ru
脚本地址:https://greasyfork.org/zh-CN/scripts/515897
注意安装脚本前必须浏览器有油猴插件
没有可前往油猴插件官网安装:首页 | Tampermonkey



如果可以,希望小伙伴们点赞和收藏,这是我的更新动力!
如果可以,希望小伙伴们点赞和收藏,这是我的更新动力!
 

若有收获,就点个赞吧

### ChatGPT4O 和 O1 的介绍 #### GPT系列的发展历程 GPT,即Generative Pre-trained Transformer,是基于Transformer架构开发的一类先进语言模型。这类模型通过大规模无监督学习,在海量文本数据集上进行了预训练,从而具备大的自然语言处理能力[^1]。 #### ChatGPT4O概述 关于ChatGPT4O的信息较为有限,通常认为这是指代GPT-4构建的应用程序之一。GPT-4作为第四代成对抗网络技术的产品,继承并发扬了前几代的优点,进一步提升了性能与功能特性。不过具体到ChatGPT4O这个名称下的产品细节,则需依据官方文档或实际应用环境来确认其独特之处[^2]。 #### O1模型的特点 O1是在特定应用场景下优化过的大型语言模型版本。相较于传统的大规模预训练模型,O1展现出了更的任务执行能力和更高效的多步推理机制。该模型能够在缺乏外部干预的前提下自主完成复杂的逻辑推导,并且支持连续性的“内部对话”,使得它特别适合用于解答涉及多个子问题的整体难题。尽管如此,这种深入思考的方式也可能造成初次回应时间相对较长的情况出现[^3]。 ### 两者之间的主要差异 | 特性 | ChatGPT4O (假设为GPT-4) | O1 | |---------| | **基础架构** | 基于最新GPT架构 | 针对某些任务做了特殊优化的LLM | | **解决问题方式** | 可能侧重于快速提供初步答案 | 更加注重逐步解析复杂问题 | | **响应速度** | 较快 | 初始响应可能较慢 | | **适用范围** | 广泛适用于各种类型的文本成和交互 | 对于需要细致分析或多步骤解决方案更为擅长 |
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值