小白视角下的AI大模型-CSDN博客

本文链接：https://blog.csdn.net/weixin_43321489/article/details/140795196

在这里插入图片描述

A了个I

一些概念
ChatGPT
参考文献

一些概念

Meta公司，原名 Facebook。创始人兼首席执行官马克·扎克伯格。
Meta AI
Meta AI是一个虚拟助手。2024年4月18日，Meta公司发布其最新大型语言模型Llama 3的早期版本，以及一款可在用户输入提示时实时更新图片的图像生成器，这些模型将被整合到虚拟助手Meta AI中。
Llama
2024年7月24日，Meta AI 才发布最新的开源模型 SOTA Llama 3.1-405B。
开源 AI 模型
最强闭源模型，Claude 3.5 Sonnet
AI、AR 和 VR
AI（人工智能）。人工智能是一种模拟人类智能的技术，它使计算机能够从数据中学习并自主决策。AI的核心算法包括机器学习、深度学习和自然语言处理等，这些算法使计算机能够处理大量数据并从中提取有用的信息。AI已经被应用于很多领域，包括自动驾驶汽车、语音助手、图像识别和医疗诊断等。
AR（增强现实）。增强现实是一种将数字信息叠加到现实世界中的技术，以增强用户的感官体验。AR技术通常通过手机、平板电脑或头戴设备等展现数字信息，例如虚拟物体、信息标签或实时反馈。AR技术已经被广泛应用于游戏、教育和培训等领域。

VR（虚拟现实）。虚拟现实是一种通过计算机生成的虚拟环境，让用户可以与其互动。VR技术通常需要使用头戴式显示器、手柄、传感器和计算机等硬件设备，以模拟用户的感官体验，例如视觉、听觉和触觉等。VR技术已经被广泛应用于游戏、模拟器和虚拟旅游等领域。
自然语言处理、计算机视觉领域
大模型不仅在自然语言处理、计算机视觉等领域取得了突破性进展，还在推动计算产业的范式转换。
生成式 AI ( Generative AI )
比如说，我如果想画一个中国老头在夕阳下喝着威士忌，旁边还有三只狗，一只是拉布拉多，一只是金毛贵宾犬，一只是伯恩山地犬 —— AI 都能生成相当逼真且准确的形象。用 DALL-E 3 绘制黄仁勋的这段 Prompt：
DALL-E 3是OpenAI图像生成模型的第三个版本
Creator AI 和 AI Studio
这是近期的一个新闻：Meta 推出了 AI Studio，允许用户在 Instagram 或网络上创建自己的 AI 形象。这个工具使用 Llama 3.1 构建，任何人都可以创建和发现 AI 角色。创作者和企业主可以将 AI 角色作为自己的延伸，回答常见问题，包括分享在帖子中展示的服装链接、过去的视频和关于自己的事实。此外，用户还可以自定义 AI 角色的名称、个性、语气、头像和标语。不仅如此，AI Studio 还支持创建更有限的 AI 角色，例如提供烹饪提示、帮助撰写 Instagram 标题和生成表情包的 AI。
Segment Anything Model
Meta AI 推出的一款 AI 模型，只需单击即可“切割”任何图像中的任何物体。
大模型
AGI
Artificial General Intelligence
通用人工智能；
它是一种可以执行复杂任务的人工智能，能够完全模仿人类智能的行为，能够执行任何人类智能活动的计算机系统。
OpenAI
OpenAI 是一家开放人工智能研究和部署公司，其使命是确保通用人工智能(AGI)造福全人类，创立于2015年12月。
埃隆·马斯克是初始投资人、联合创始人之一，后因 OpenAI 从非营利机构转型为盈利组织后与其决裂。
后来，微软是OpenAI最大投资者。OpenAl的技术(ChatGPT)整合到微软旗下搜索引擎必应、营销软件、GitHub编码工具、Micro-soft 365办公软件中，构建AI服务体系。
苹果将来可能会把ChatGPT集成到即将发布的手机系统iOS18中。
2022年11月，全新聊天机器人模型ChatGPT问世；
2024年2月，文生视频大模型Sora问世；
2024年5月，推出GPT-4o，处理文本、图像、音频能力更自然、流畅。GPT-4o的名称中“o”代表Omni，即全能的意思。

ChatGPT

前言

OpenAI 公司旗下产品；
ChatGPT的一个最最基本也是核心的功能，就是问答；
ChatGPT分为两部分：Chat 和 GPT；
Chat即聊天；
GPT即Generative Pre-trained Transformer；
Genrative是生成式的意思，它的作用是可以创造或者生产一些新的东西;
Pre-trained意思是它从大量的资料中学习而来，预先经过了大量样本的训练；
Transformer指GPT本质上是一种神经网络模型。
阶段1
阶段1的ChatGPT本质上只是一种自然语言处理模型（NLP），它的特点就是只能接受文字输入，并且也只能以文字输入。
阶段2
GPT4
现在的ChatGPT，其实已经进行过两次升级，第一次是GPT4，具有更准确的回答能力。
阶段3
GPT Turbo
GPT Turbo是ChatGPT的最新升级；
GPT Turbo 是一种叫多模态的大模型，它跟第一代不同的地方就在于它不仅可以接收和输出文字，还具备处理其他类型如图片、文档、视频等的能力。这意味着它可以输入文本、图像、视频或文件，从而生成（输出）文本、图像、视频或文件。

收费与免费？

一、免费版
在官网上，只需注册账号后，即可进行网页对话。免费版访问速度、回复次数、高级功能的使用会收到一定的限制。
二、付费版（ChatGPT Plus）
付费版本享有：更快的访问速度、优先使用权、更详细的回答、更复杂的对话生成等。
目前的收费标准为每月20美元，价格可能会随时调整。
三、其他收费方式
一些第三方平台的会员费、增值服务费等。

普通用户如何使用GPT？

网页端体验
openai官网；
注册账号；
网页端ChatGPT对话；
微信小程序体验
微信小程序中搜索“ChatGPT”。
国内镜像站点体验
openai-widget
使用第三方工具或服务如：Notion、Webflow等。

OpenAI的API（应用程序接口）？

OpenAI 提供了一个强大的API，比如GPT（现在称为ChatGPT的基础）、DALL-E等，用于各种自然语言处理和图像生成任务。
使用步骤：

注册OpenAI账号
前往 OpenAI官网注册一个账号。
创建API密钥
在OpenAI的仪表盘中，你可以创建一个或多个API密钥，用于认证你的API请求。
阅读API文档
OpenAI为不同的服务（如GPT, DALL-E等）提供了详细的API文档。这些文档描述了每个API的端点、请求参数、响应格式等。
使用HTTP客户端发送请求
你可以使用任何支持HTTP请求的编程语言或工具（如curl, Python的requests库, Postman等）来发送请求到OpenAI的API。在请求头中，你需要包含你的API密钥以进行认证。

处理响应
根据API的响应，你的程序可以解析并处理这些数据。
以下是一个使用Python和requests库调用OpenAI GPT API的简单示例：

import requests  
  
# 替换为你的API密钥  
API_KEY = 'YOUR_API_KEY'  
  
# OpenAI API的端点  
URL = "https://api.openai.com/v1/engines/davinci-codex/completions"  
  
# 你的请求体，包括要生成文本的提示  
data = {  
    "prompt": "用Python编写一个打印'Hello, world!'的程序",  
    "max_tokens": 10,  
    "temperature": 0.5,  
    "top_p": 1.0,  
    "frequency_penalty": 0.0,  
    "presence_penalty": 0.0  
}  
  
# 发送POST请求  
headers = {  
    "Authorization": f"Bearer {API_KEY}",  
    "Content-Type": "application/json",  
}  
  
response = requests.post(URL, headers=headers, json=data)  
  
# 打印响应  
print(response.json())