ChatGPT 和生成式 AI 年度回顾：16个精彩瞬间(1)，一文搞懂

最新推荐文章于 2024-08-29 10:48:26 发布

2401_84301948

最新推荐文章于 2024-08-29 10:48:26 发布

阅读量666

点赞数 24

分类专栏： 2024年程序员学习文章标签： chatgpt 人工智能

本文链接：https://blog.csdn.net/2401_84301948/article/details/137848267

版权

2024年程序员学习专栏收录该内容

36 篇文章 0 订阅

订阅专栏

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新Golang全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上Go语言开发知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip1024b （备注go）

正文

2023 年 10 月，OpenAI 推出了 DALLE-3，这是其革命性的人工智能文本到图像生成器的最新版本。DALLE-3 代表了在生成准确反映书面提示的图像方面的重大飞跃-这是人工智能图像合成中臭名昭着的挑战。

与以前的版本相比，DALLE-3 显著提高了对提示文本的理解和遵从性。它现在可以处理更长的、更详细的提示，而不会丢失上下文或忽略关键字。这将产生更符合用户预期视觉的图像。

DALLE-3 还引入了更高的分辨率和更逼真的输出。

一个突出的新功能是与 ChatGPT 的集成，允许用户简单地向聊天机器人描述图像想法。然后， ChatGPT 将自动生成一个定制的提示段落，以提供给 DALLE-3。如果需要，用户可以通过要求 ChatGPT 改进提示来进行迭代。这简化了提示工程过程。

OpenAI 在此版本中优先考虑安全性，采取措施防止不适当或有偏见的内容。DALLE-3 拒绝模仿在世艺术家的风格或未经许可代表公众人物的请求。该公司现在允许艺术家选择不使用他们的作品来训练未来的迭代。

DALL-E 3 Protections

7. OpenAI 的首个开发者日 - 更多进展

OpenAI Dev Day

OpenAI 于 2023 年 11 月 6 日举行的首次开发日开发者大会，标志着该公司的一个重要里程碑。在主题演讲中，首席执行官 Sam Altman 公布了许多新的 AI 功能，api 和产品。正如我们将在下面看到的，开发日发布了GPT-4 Turbo、助手 API、自定义 GPTs 和 GPT 商店。

Dev Day 强调了 OpenAI 致力于快速迭代和扩展其 AI 的访问。这次活动展示了在能力和灵活性上的巨大飞跃。通过改进的模型、新的 api 和像 GPT 商店这样的产品，OpenAI 正在使开发人员和用户能够根据他们的独特需求塑造 AI。这些公告显示了 OpenAI 在引领AI革命方面的优势地位。

8. GPT-4 Turbo - 性能改进

GPT-4 Turbo 代表了 OpenAI 的下一代文本生成 AI 模型 GPT-4。在 OpenAI 的第一个开发日上宣布，GPT-4 Turbo 比2023 年 3 月发布的原始 GPT-4 提供了一些改进。

最值得注意的是，GPT-4 Turbo 已经根据截至 2023 年 4 月的数据进行了训练，而不仅仅是 GPT-4的 2021 年 9 月的数据。这为模型在响应提示时提供了更多最新的知识。GPT-4 Turbo 还支持更大的上下文大小，多达 128000 个 token，使其能够理解更多的上下文并产生更周到的响应。

此外，GPT-4 Turbo 具有优化的性能和定价。它的成本是每 1000 个输入 0.01 美元，每 1000 个输出 0.03 美元，这使得它比 GPT-4 更实惠。OpenAI 指出，与 GPT-4 相比，输入定价便宜 3 倍，输出定价便宜 2 倍。

目前，开发人员可以通过 API 访问 GPT-4 Turbo 预览版。随着模型超越测试版，OpenA I计划在未来几周内发布完整的生产版本。API 预览已经使开发人员能够开始集成和测试 GPT-4 Turbo 的增强功能。

9. GPT - 自定义模型

GPTs Configuration

GPTs，或自定义 AI 模型，代表了一种新方法，任何人都可以为特定的用例创建定制的 ChatGPT版本，而无需编码。正如在开发日上宣布的那样，GPTs 允许用户结合指令、知识源和技能来构建定制的 AI 代理。

例如，老师可以创建一个专注于数学教育的 GPT 来帮助学生学习。或者，游戏公司可能会建立一个可以回答幻想世界中错综复杂的知识和角色问题的系统。从本质上讲，GPTs 为普通人开启了一种能力，让他们能够根据自己的独特需求塑造 ChatGPT 的功能。

GPTs 通过将 ChatGPT 的广泛知识转化为有针对性的专业知识来提供价值。它们还允许用户纠正错误信息，保持知识更新，并通过持续的指导防止有害响应。通过自定义行为，GPTs 可以变得更加有用和可靠。

10. GPT Store - 分享想法

GPT Store

GPT商店代表了人们如何访问和利用AI技术的重大转变。它允许任何人为特定的用例创建和分发定制的ChatGPT版本(称为GPTs)，而不需要编写代码。

GPT 商店提供了一个分享这些AI作品并可能变现的平台。经过验证的构建者可以发布他们的GPTs，让他们可以通过搜索和排行榜被发现。在接下来的几个月里，他们还可以根据使用情况赚钱。

这与非常成功的 app store 模式类似，但适用于人工智能模式，而不是移动应用。它激励构建者创造创造性的 GPTs，为他人提供价值。GPT 商店可以在将 AI 应用于特定用例方面释放一波创造力，就像移动应用程序的激增一样。

通过通过 GPT 商店普及可定制 AI 的访问，OpenAI 正在围绕定制模型建立一个生态系统和经济。基于平台创建者和构建者的创新性，ChatGPT 的功能有可能迅速扩展到新的领域。

11. OpenAI Sam Altman 的解雇和重新雇用 - 内部动荡

Sam Altman Firing Reaction on X

风靡全球的人工智能聊天机器人 ChatGPT 背后的 OpenAI 公司，在短短五天内经历了一次奇怪的高管人事变动，包括解雇和重新聘用首席执行官萨姆·奥特曼。这个传奇故事就像一部错误的喜剧，情节的曲折和逆转堪比情景喜剧。

11 月 17 日，OpenAI 董事会突然解雇了奥特曼，并没有给出明确的解释。考虑到奥特曼作为联合创始人的身份，以及在他的领导下 ChatGPT 最近取得的成功，这一举动震惊了许多人。当数百名OpenAI 员工发起反抗，威胁如果奥特曼不复职就辞职时，事情变得更加复杂了。

他们认为，奥特曼对于维护 OpenAI 安全开发人工智能以造福人类的使命至关重要。微软意识到这是一个机会，于是聘请奥特曼领导一个新的人工智能项目，试图挖走他和其他员工。在 ChatGPT刚刚起步的时候，这一权力变动有可能扼杀 OpenAI。

令人意外的是，OpenAI 董事会在解雇奥尔特曼仅仅五天之后就同意让他重新担任 CEO。

作为交易的一部分，大多数老董事会成员辞职。

似乎结局好一切都好，但这个传奇故事暴露了幕后的一些重大戏剧性事件。这是一个曲折和情感的过山车——困惑，愤怒，阴谋，解脱——值得肥皂剧。

在这一天结束的时候，奥特曼得意洋洋地出现了，他的声誉和影响力得到了加强。然而，OpenAI 内部的权力斗争远未解决。随着他们继续塑造人工智能的未来，这不会是硅谷最热门的初创公司的最后一次情节转折。

更广泛的人工智能领域的发展

随着 OpenAI 和 ChatGPT 的迅速崛起，生成式 AI 也有了许多重要的发展。

12. Google Bard 发布

2023 年 2 月，谷歌推出了基于 LaMDA 和 PaLM 2 LLM 的人工智能聊天机器人 Bard。随着ChatGPT 的流行，谷歌推出了自己的人工智能，包括推理、编码和多语言功能。与 ChatGPT 不同，Bard 从网络上提取信息。

13. LLaMA开源语言模型

Llama 1 于 2022 年 7 月首次推出，是一个拥有 70 亿个参数的开源对话人工智能模型。它是在GitHub 上提供的，用于研究目的。Llama 1 表现出很强的对话能力，但其有限的尺寸限制了更复杂的推理。

一年后，也就是 2023 年 7 月，Meta 和微软宣布发布 Llama 2，代表了拥有 700 亿个参数的下一代模型。Llama 2 经过优化，可以在 Windows 和 Azure 云上高效运行。它还集成了更好的内容过滤以确保安全。更大的 Llama 2 解锁了更复杂的推理能力。

2023 年 8 月，IBM 宣布计划在其沃森人工智能平台上也提供 Llama 2。这将使企业用户能够访问Llama 2 的增强功能。IBM 还表示，在发布“Llama 2”之后，将推出自己的人工智能开发模型和工具。

14. Pandas AI

2023 年 6 月，广受欢迎的 Pandas Python 库添加了一系列人工智能功能来增强其功能。Pandas AI 可以使用自然语言对 Pandas 数据框架数据进行汇总。此外，您可以使用它来绘制复杂的可视化、操作数据框架和生成业务见解。

它是一个初学者友好的工具;即使是没有什么技术背景的人也可以使用它来执行复杂的数据分析任务，帮助您更快地分析数据并得出有意义的结论。

15. Mistral 7B 开源语言模型

Mistral 7B 是由总部位于巴黎的法国初创公司 Mistral AI 于 2023 年 9 月发布的。

Mistral 7B 是一种开源语言模型，在保持效率的同时提供了令人印象深刻的性能。它只有 70 亿个参数，在许多基准测试中都优于 Meta 的 Llama 213B 等大型专有模型。Mistral 较小的尺寸使其对于希望构建自定义 AI 应用程序的开发人员和组织来说更容易访问和灵活。

Mistral 的突出特点之一是它的多功能性——它既擅长于文本生成等自然语言任务，也擅长于编码相关任务。与其他只关注自然语言的语言模型相比，这种双重优势使其具有独特的价值。

16. Stable Video Diffusion

Stability AI于 2022 年 11 月 22 日发布了稳定视频扩散研究预览。

Stable Video Diffusion 是 Stability AI 发布的首个视频 AI 新模型，可以从静态图像生成动画短视频。它建立在 Stability AI 流行的稳定扩散图像生成模型的基础上，代表了该公司首次涉足生成视频合成。

该模型有两个版本—— SVD 和 SVD-XT。SVD 可以将图像转换成 14 帧的视频，而 SVD-XT 可以生成 25 帧的视频，两者的帧率都在 3 ~ 30 帧/秒之间。这些模型先在包含数百万个视频的大型数据集上进行训练，然后再对数十万个视频片段进行微调，最终达到约 100 万个视频片段。

总结

在生成式人工智能领域，过去的一年可以说是革命性的，有突破性的进展和重要的里程碑。ChatGPT 的推出为这一年的快速进展奠定了基调，使对话式人工智能的访问民主化，并引发了关于先进人工智能系统影响的重要对话。今年晚些时候引入了 GPT-4，其功能得到了扩展，进一步突显了该领域的快速发展步伐。

将 DALLE-3 集成到这个生态系统中，为人工智能功能带来了一个新的维度，增强了从文本描述生成详细的上下文感知图像的能力。这种整合不仅推动了人工智能创造力的界限，而且强调了人工智能开发中伦理考虑和安全的重要性。

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注Go）

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
到真正的技术提升。**

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注Go）
[外链图片转存中…(img-ShD7D3YO-1713291921434)]

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

2401_84301948

关注

24
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
ChatGPT 和生成式 AI 年度回顾：16个精彩瞬间(1)，一文搞懂

GPTs，或自定义 AI 模型，代表了一种新方法，任何人都可以为特定的用例创建定制的 ChatGPT版本，而无需编码。正如在开发日上宣布的那样，GPTs 允许用户结合指令、知识源和技能来构建定制的 AI 代理。例如，老师可以创建一个专注于数学教育的 GPT 来帮助学生学习。或者，游戏公司可能会建立一个可以回答幻想世界中错综复杂的知识和角色问题的系统。从本质上讲，GPTs 为普通人开启了一种能力，让他们能够根据自己的独特需求塑造 ChatGPT 的功能。
复制链接

扫一扫