【AI大模型深度解析】函数调用Function Calling：人机交互接口、应用程序编程接口、语言界面接口、AI大模型的缺陷与补救措施，以及函数调用如何为AI大模型赋能

拥抱AGI

于 2024-08-20 11:51:56 发布

阅读量481

点赞数 16

文章标签：人工智能人机交互大数据职场和发展深度学习大模型 AI大模型

本文链接：https://blog.csdn.net/2401_85375151/article/details/141354576

版权

文章目录

一、接口概念
- 1、接口类型 - 人机交互接口 / 应用程序编程接口
- 2、人机交互口的发展 - 命令行 -> 图形界面 -> 语言界面 -> 脑机
- 3、应用程序编程接口的发展 - 本地 -> 远程 -> 自然语言接口
二、AI 大模型缺陷与补救措施 - 函数调用 Function Calling 引入
- 1、AI 大模型原理
- 2、AI 大模型缺陷
- 3、函数调用 Function Calling 引入
- 4、" 真逻辑 " 要求
- 5、函数调用 Function Calling 为大模型赋能 " 真逻辑 "

一、接口概念

1、接口类型 - 人机交互接口 / 应用程序编程接口

接口类型 : " 接口 " 的关键就是 , 使用接口的双方要遵守 " 事先约定 " ;

人之间的交互接口 : 通过语言、表情、动作进行交流 ;
人机交互接口 : Human-Computer Interaction Interface , 简称 " HCI Interface " , 是人与计算机系统之间建立联系 , 交换信息的输入 / 输出设备的接口 , 输入 / 输出设备主要有键盘、显示器、打印机、鼠标等 ;
- 核心是 " 人 " 要遵守接口的规定 , 来操作计算机系统 ;
- 计算机系统不懂人的语言 , 需要事先定义计算机可以理解的与人交互的 " 接口 " , 人要学习计算机可理解的接口 ;
应用程序编程接口 : Application Programming Interface , 简称 " API " , 是一组预定义的函数、协议和工具 , 用于实现软件应用程序之间的通信和交互 , API 允许开发人员在不访问源代码或理解内部工作机制的情况下 , 调用和使用特定的软件功能或服务 ;
- 核心是 " 应用程序 " 要遵守接口的规定 , 来调用计算机系统中的另外一个应用程序提供的服务 ;
- 应用程序之间是不知道另外一个应用程序的实现机制的 , 需要事先约定如何提供服务 , 如何进行调用服务 ;

2、人机交互口的发展 - 命令行 -> 图形界面 -> 语言界面 -> 脑机

人机交互口的发展 :

命令行接口 : Command Line Interface , 简称 " CLI " , 这是最早的人机交互方式 , 用户通过文本命令操作计算机系统 , 程序员需要受到严格训练 , 才能流畅使用该接口 ; 常见的命令行接口有
- DOS
- Linux shell
- Windows Power Shell
图形界面接口 : Graphical User Interface , 简称 " GUI " , 应用程序靠图标、窗口、菜单等图形元素来与用户交互 , 极大地降低了使用难度 , 用户需要简单学习 , 可以使用该接口 ;
语言界面接口 : Conversational User Interface , 简称 " CUI " , 或 Natural-Language User Interface , 简称 " LUI " , 通过自然语言对话的方式与计算机系统进行交互 , 如 : 汉语、俄语、英语 ; 这种交互方式更加直观、自然 , 用户无需记忆复杂的命令或操作图形元素 , 不需要学习只要会说话就可以操作该接口 ; 常见的语言界面接口 :
- 智能音箱 : 小米 / 华为智能音箱 ;
- 手机助手 : Siri ;
- GPT 大模型 : 文心一言 / ChatGPT ;

语言界面在智能家居、智能客服、语音助手等领域得到了广泛应用 ;
在这里插入图片描述

脑机接口 : Brain–Computer Interface , 简称 " BCI " , 允许用户通过大脑活动来与计算机进行交互 , 涉及脑电图 EEG 等神经科学技术 , 以捕捉和解析大脑信号 ; 不需要会说话 , 只要不是傻子就可以使用该接口 ;

3、应用程序编程接口的发展 - 本地 -> 远程 -> 自然语言接口

应用程序编程接口的发展 :

本地 -> 远程 API : 早期 API 只应用于本地或局域网内的程序间通信 , 随着互联网发展 , 远程 API 使得不同地理位置的进程能够相互交互 ;
同步 -> 异步 API : 同步 API 要求客户端在请求后等待服务器响应 , 异步 API 允许客户端在等待响应的同时继续执行其他任务 , 提高了程序的效率和响应性 ;
传统 API 本质不变 : 传统的 API 本质都是程序员互相约定好 , 服务方给出文档接口 , 使用方按照文档接口进行开发 , 使用服务方功能 ;
自然语言接口 : Natural-Language Interface , 简称 " NLI " , 所有的软件都可以提供 NLI 接口 , 软件进程之间传递自然语言 , 互相之间不再使用 API , 而是使用自然语言进行协同交互 , 无需编写代码或遵循特定的语法规则 , 使得非技术人员也能轻松地与软件系统进行交互和定制 ;

上述发展仅仅是从 AI 大模型角度出发考虑的应用程序编程接口发展问题 , 短时间内实现的可能性不大 ;

二、AI 大模型缺陷与补救措施 - 函数调用 Function Calling 引入

1、AI 大模型原理

GPT 大模型 ( Generative Pre-trained Transformer ) 是一种基于Transformer架构的生成式预训练语言模型 , 在大规模无监督文本数据上进行预训练 , 学习语言的普遍规律 , 从而具备生成高质量文本的能力 ;

通过预测单词序列中下一个单词的方式 , 模型能够学习到文本中的语法、语义和上下文信息 , 从而捕捉到丰富的语言知识 ;

根据概率生成文本的机制 , 如下图所示 :

提示词是 The cat ;
根据现有提示词 , 后面生成每个词的概率中 , sat 的概率是 0.5 , 概率最大 , 则生成 sat 单词 ;

在这里插入图片描述

2、AI 大模型缺陷

AI 大模型有如下缺陷 :

并非全知全能 : AI 大模型并非全知全能 , 知晓一切 , 其本身的知识仅限于训练的数据包含的内容 , 一些非公开的知识它是不知道的 , 也不会生成出来 ;
时效性差 : AI 大模型训练一次消耗很多时间和资源 , 不可能随时保持更新 , GPT 3.5 的知识截止到 2022 年 1 月 , GPT 4.0 截止到 2023 年 4 月 , 每次训练都需要花费 1 年的时间 ;
- GPT 4.0 的训练数据 , 截止到 2023 年 4 月 , 整理完数据 , 训练一年到 2024 年才能推出 ;
- AI 大模型在训练的时候 , 属于炼丹 , 一次性投入一些文本知识库 , 不知道训练结果 , 有可能变聪明了 , 有可能变傻了 ; 每次训练都要检查是否变好还是变坏 , 如果变坏就回滚 , 如果变好继续迭代 ;
没有逻辑推理能力 : AI 大模型的思维链是基于文本的统计规律生成的 , 并不具备真正的逻辑推理能力 , 其本质就是根据概率生成文本 ;
- 一些简单问题 , 根据概率生成的文本 , 看似具备逻辑推理能力 ;
- 复杂问题 , 基本上就是胡说八道 ;

3、函数调用 Function Calling 引入

AI 大模型有上述三种缺陷 , 因此需要有一种机制 , 使得 AI 大模型需要与外部进行交互 , 为 AI 大模型对接各种接口 ;

特定领域的知识或消息 , 如 : 非公开信息等 ;
专业领域的接口 , 如获取当前的时间 , 天气 , 特定领域知识请求 , 特定功能对接
具有时效性的信息 , 如 : 最新的新闻 , 最新统计数据等 ;
特定领域的逻辑推理能力

上述对接 , 可以通过函数调用 Function Calling 实现 ;

函数调用 Function Calling 是大模型与真实世界的实际业务进行联系交互的纽带 , 使用函数调用可以将大模型与实际业务进行关联 ;

4、" 真逻辑 " 要求

" 真逻辑 " 必须是符合逻辑规律、能够正确反映事物本质和规律的逻辑推理 , 有如下特点 :

正确性 : 得到的结果必须是正确的 , 不能出错 ;
一致性 : 多次推理 , 推理的步骤和结果必须一致 , 大模型根据概率生成内容 , 肯定无法达到这个要求 ;
可读性 : 不能像神经元网络一样 , 数据输入进去 , 跟炼丹一样 , 得到一个结果 , 不知道具体的推理步骤和过程 ;

GPT 大模型并没有逻辑推理能力 ;

5、函数调用 Function Calling 为大模型赋能 " 真逻辑 "

AI 大模型没有 " 真逻辑 " , 只是一个基于概率生成文本的工具 ;

代码编程 , 使用顺序 / 选择 / 循环解决的各种问题的方式 , 是 " 真逻辑 " , 可以确定性的解决各种具体的问题 ;

函数调用 Function Calling 就是使用代码实现的 " 真逻辑 " , 嵌入到 AI 大模型中 , 在大模型的概率生成文本的基础上增加确定性的 " 真逻辑 " 功能 , 可以解决所有的问题 ;

在这里插入图片描述

大模型&AI产品经理如何学习

求大家的点赞和收藏，我花2万买的大模型学习资料免费共享给你们，来看看有哪些东西。

1.学习路线图

在这里插入图片描述

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源，但基本上都残缺不全的，这是我自己整理的大模型视频教程，上面路线图的每一个知识点，我都有配套的视频讲解。

在这里插入图片描述

（都打包成一块的了，不能一一展开，总共300多集）

因篇幅有限，仅展示部分资料，需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档，有几百本，都是目前行业最新的。
在这里插入图片描述

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
在这里插入图片描述

👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。
在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

拥抱AGI

关注

16
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
【AI大模型深度解析】函数调用Function Calling：人机交互接口、应用程序编程接口、语言界面接口、AI大模型的缺陷与补救措施，以及函数调用如何为AI大模型赋能

函数调用 Function Calling 就是使用代码实现的 " 真逻辑 " , 嵌入到 AI 大模型中 , 在大模型的概率生成文本的基础上增加确定性的 " 真逻辑 " 功能 , 可以解决所有的问题;• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；" 接口 " 的关键就是 , 使用接口的双方要遵守 " 事先约定 ";
复制链接

扫一扫