一些概念
-
Meta公司,原名 Facebook。创始人兼首席执行官马克·扎克伯格。
-
Meta AI
Meta AI是一个虚拟助手。2024年4月18日,Meta公司发布其最新大型语言模型Llama 3的早期版本,以及一款可在用户输入提示时实时更新图片的图像生成器,这些模型将被整合到虚拟助手Meta AI中。 -
Llama
2024年7月24日,Meta AI 才发布最新的开源模型 SOTA Llama 3.1-405B。 -
开源 AI 模型
最强闭源模型,Claude 3.5 Sonnet
-
AI、AR 和 VR
AI(人工智能)。人工智能是一种模拟人类智能的技术,它使计算机能够从数据中学习并自主决策。AI的核心算法包括机器学习、深度学习和自然语言处理等,这些算法使计算机能够处理大量数据并从中提取有用的信息。AI已经被应用于很多领域,包括自动驾驶汽车、语音助手、图像识别和医疗诊断等。
AR(增强现实)。增强现实是一种将数字信息叠加到现实世界中的技术,以增强用户的感官体验。AR技术通常通过手机、平板电脑或头戴设备等展现数字信息,例如虚拟物体、信息标签或实时反馈。AR技术已经被广泛应用于游戏、教育和培训等领域。
VR(虚拟现实)。虚拟现实是一种通过计算机生成的虚拟环境,让用户可以与其互动。VR技术通常需要使用头戴式显示器、手柄、传感器和计算机等硬件设备,以模拟用户的感官体验,例如视觉、听觉和触觉等。VR技术已经被广泛应用于游戏、模拟器和虚拟旅游等领域。
-
自然语言处理、计算机视觉领域
大模型不仅在自然语言处理、计算机视觉等领域取得了突破性进展,还在推动计算产业的范式转换。 -
生成式 AI ( Generative AI )
比如说,我如果想画一个中国老头在夕阳下喝着威士忌,旁边还有三只狗,一只是拉布拉多,一只是金毛贵宾犬,一只是伯恩山地犬 —— AI 都能生成相当逼真且准确的形象。用 DALL-E 3 绘制黄仁勋的这段 Prompt:
-
DALL-E 3是OpenAI图像生成模型的第三个版本
-
Creator AI 和 AI Studio
这是近期的一个新闻:Meta 推出了 AI Studio,允许用户在 Instagram 或网络上创建自己的 AI 形象。这个工具使用 Llama 3.1 构建,任何人都可以创建和发现 AI 角色。创作者和企业主可以将 AI 角色作为自己的延伸,回答常见问题,包括分享在帖子中展示的服装链接、过去的视频和关于自己的事实。此外,用户还可以自定义 AI 角色的名称、个性、语气、头像和标语。不仅如此,AI Studio 还支持创建更有限的 AI 角色,例如提供烹饪提示、帮助撰写 Instagram 标题和生成表情包的 AI。 -
Segment Anything Model
Meta AI 推出的一款 AI 模型,只需单击即可“切割”任何图像中的任何物体。
-
大模型
-
AGI
Artificial General Intelligence
通用人工智能;
它是一种可以执行复杂任务的人工智能,能够完全模仿人类智能的行为,能够执行任何人类智能活动的计算机系统。 -
OpenAI
OpenAI 是一家开放人工智能研究和部署公司,其使命是确保通用人工智能(AGI)造福全人类 ,创立于2015年12月。
埃隆·马斯克是初始投资人、联合创始人之一,后因 OpenAI 从非营利机构转型为盈利组织后与其决裂。
后来,微软是OpenAI最大投资者。OpenAl的技术(ChatGPT)整合到微软旗下搜索引擎必应、营销软件、GitHub编码工具、Micro-soft 365办公软件中,构建AI服务体系。
苹果将来可能会把ChatGPT集成到即将发布的手机系统iOS18中。
2022年11月,全新聊天机器人模型ChatGPT问世;
2024年2月,文生视频大模型Sora问世 ;
2024年5月,推出GPT-4o,处理文本、图像、音频能力更自然、流畅。GPT-4o的名称中“o”代表Omni,即全能的意思。
ChatGPT
前言
OpenAI 公司旗下产品;
ChatGPT的一个最最基本也是核心的功能,就是问答;
ChatGPT分为两部分:Chat 和 GPT;
Chat即聊天;
GPT即Generative Pre-trained Transformer;
Genrative是生成式的意思,它的作用是可以创造或者生产一些新的东西;
Pre-trained意思是它从大量的资料中学习而来,预先经过了大量样本的训练;
Transformer指GPT本质上是一种神经网络模型。
阶段1
阶段1的ChatGPT本质上只是一种自然语言处理模型(NLP),它的特点就是只能接受文字输入,并且也只能以文字输入。
阶段2
GPT4
现在的ChatGPT,其实已经进行过两次升级,第一次是GPT4,具有更准确的回答能力。
阶段3
GPT Turbo
GPT Turbo是ChatGPT的最新升级;
GPT Turbo 是一种叫多模态的大模型,它跟第一代不同的地方就在于它不仅可以接收和输出文字,还具备处理其他类型如图片、文档、视频等的能力。这意味着它可以输入文本、图像、视频或文件,从而生成(输出)文本、图像、视频或文件。
收费与免费?
- 一、免费版
在官网上,只需注册账号后,即可进行网页对话。免费版访问速度、回复次数、高级功能的使用会收到一定的限制。 - 二、付费版(ChatGPT Plus)
付费版本享有:更快的访问速度、优先使用权、更详细的回答、更复杂的对话生成等。
目前的收费标准为每月20美元,价格可能会随时调整。 - 三、其他收费方式
一些第三方平台的会员费、增值服务费等。
普通用户如何使用GPT?
- 网页端体验
openai官网;
注册账号;
网页端ChatGPT对话; - 微信小程序体验
微信小程序中搜索“ChatGPT”。 - 国内镜像站点体验
openai-widget - 使用第三方工具或服务如:Notion、Webflow等。
OpenAI的API(应用程序接口)?
OpenAI 提供了一个强大的API,比如GPT(现在称为ChatGPT的基础)、DALL-E等,用于各种自然语言处理和图像生成任务。
使用步骤:
- 注册OpenAI账号
前往 OpenAI官网 注册一个账号。 - 创建API密钥
在OpenAI的仪表盘中,你可以创建一个或多个API密钥,用于认证你的API请求。 - 阅读API文档
OpenAI为不同的服务(如GPT, DALL-E等)提供了详细的API文档。这些文档描述了每个API的端点、请求参数、响应格式等。 - 使用HTTP客户端发送请求
你可以使用任何支持HTTP请求的编程语言或工具(如curl, Python的requests库, Postman等)来发送请求到OpenAI的API。在请求头中,你需要包含你的API密钥以进行认证。 - 处理响应
根据API的响应,你的程序可以解析并处理这些数据。
以下是一个使用Python和requests库调用OpenAI GPT API的简单示例:import requests # 替换为你的API密钥 API_KEY = 'YOUR_API_KEY' # OpenAI API的端点 URL = "https://api.openai.com/v1/engines/davinci-codex/completions" # 你的请求体,包括要生成文本的提示 data = { "prompt": "用Python编写一个打印'Hello, world!'的程序", "max_tokens": 10, "temperature": 0.5, "top_p": 1.0, "frequency_penalty": 0.0, "presence_penalty": 0.0 } # 发送POST请求 headers = { "Authorization": f"Bearer {API_KEY}", "Content-Type": "application/json", } response = requests.post(URL, headers=headers, json=data) # 打印响应 print(response.json())
开发者如何使用GPT?
使用OpenAI的API。
企业如何使用GPT来为自身附能?
待续…
参考文献
【0】文心一言
【1】https://baijiahao.baidu.com/s?id=1760722647461569825&wfr=spider&for=pc
【2】致敬 Linus?老黄和小扎的万字欢乐对话实录:开源必胜,去他的闭源 AI!
【3】https://www.zhihu.com/question/598243591/answer/3331628116