【MaxKB与大模型相关的知识科普-新手快速进阶】

什么是LLM

LLM是Large Language Models的简称,翻译过来就是大语言模型,国内常见的大语言模型有:文心一言、通义千问、kimi、豆包等等。
常见的大语言模型

LLM与 AIGC之间的联系

AIGC是一个总称,是指有能力生成内容的人工智能模型,其中内容不限制于:文本、代码、视频、音乐、图片等等。像常见的开源AIGC技术有:LLama、阿里的通义千问都是AIGC技术。
范围关系

什么是MaxKB?MaxKB和LLM之间有什么联系?脱离LLM能否独立使用?对企业来讲,既然MaxKB无法独立使用,那我为什么还要使用MaxKB,我直接本地部署离线的开源大模型不行吗?

MaxKB 是一款基于 LLM 大语言模型的开源知识库问答系统,通过字面意思也不难看出,它需要配合大语言模型配合使用,并且MaxKB与 LLM的联系就是:需要用到LLM来生成并优化相关的返回内容。如果直接使用本地部署的离线模型,就会出现已读乱回的现象。原因是由于直接使用LLM,生成LLM前预训练的数据专业性不够、且模型当时预训练的数据内容是固定的,只要模型提供商不迭代,那么模型性能就得不到提升,就会导致回答的知识准确度就差很多。这时候,一般需要企业有专门的AI工程师去进行微调,才可以应用到不同的领域、不同的专业。
MaxKB登录页面

微调怎么理解?

如何在固定的领域,或者特定的场景,让LLM的回答更准确,就需要AI工程师拿相关领域或专业的数据去进行模型优化,这个就叫微调。微调的投入成本是非常高的,1. 需要专业的技术人才 2. 模型的维护成本高,微调就像一个黑匣子,你无法直接看到背后的模型是基于哪些数据进行了训练。且随着知识的迭代,需要不断重复此过程。
微调过程

MaxKB是用到了什么技术来应用到不同的行业领域呢

用到了RAG(检索增强生成),翻译成中文就是检索增强生成。

RAG(检索增强生成)怎么理解?为什么企业需要RAG?

简单来讲,RAG就是通过检索获取相关的知识并将其融入Prompt,让大模型能够参考相应的知识从而给出合理回答。因此,可以将RAG的核心理解为“检索+生成”,前者主要是利用向量数据库的高效存储和检索能力,召回目标知识;后者则是利用大模型和Prompt工程,将召回的知识合理利用,生成目标答案。虽然LLM拥有强大的语言理解和生成能力,但它们在处理特定领域知识或需要最新信息反馈的时候就会受到限制,因为这些模型可能是过时的数据上进行预训练的。而RAG就可以弥补这一不足,它通过检索最新的、相关的信息来辅助LLM生成更准确的答案。
RAG技术实现

如何增强MaxKB回答的准确性?

  1. 知识文档方面的优化
    文本规范化处理,去除文本中特殊字符、不相关的信息以及冗余信息,合理地进行文档分段等。
  2. 向量检索方面的优化
    自定义embedding模型,结合知识库数据量的大小,设置不同的搜索模式和调整相似度值、TOP分段等。
  3. 提示词方面的优化
    依据问答场景设置不同的提示词来引导模型,使其能够更好地适应各种应用场景。
  4. 模型层面的优化
    接入参数更多,性能更强,数据训练更新的模型;或者按需接入用户自行微调的模型。

RAG和MaxKB的工作原理介绍?介绍中会提到向量模型、向量化处理、分段、Prompt,他们分别又是什么?

RAG原理示意图

图片为借用供参考

MaxKB原理示意图

MaxKB工作原理

  1. 在数据准备阶段,MaxKB通过离线文件导入或者在线文档爬取的形式,生成知识库,通过向量化模型的处理,将相应的数据存入向量数据库。具体的数据格式呢,我们不用去管,因为人是看不懂的,这些向量数据库中的数据是给机器看的,可以让机器拥有视觉效果。
  2. 在提问阶段,我们根据用户的提问,通过高效的检索方法,召回与提问最相关的知识,并融入Prompt(提示词工程);
  3. 最后是回答阶段,大模型参考当前提问和相关知识,生成相应的答案。

对于企业来讲为什么需要MaxKB

  1. 降本增效
    使用MaxKB可以依据大语言模型创建专门的知识领域,比如阿里云发起的“物流智能联盟”,以大模型助力物流行业实现降本增效,比如像一些智能接单服务就降低了沟通成本,提高了人效。
  2. 用户体验
    MaxKB可以为用户快速的提供相对准确的问题答案,相较于人力去企业知识库中查找问题答案来说,很显然它的体验更好。
  3. 市场份额
    2023年第一季度,包括微软Azure在内的微软智能云业务挑起业务大梁,营收达220.81亿美元,同比增长16%,占总
    收入42%。微软Azure OpenA/服务已拥有2500位客户,客户数预计将较二季度增长10倍,旗下Al Copilot编程助手已经获得10000个客户。
    本季度微软搜索引擎Bing、Ofice工具等业务收入明显增长,可能离不开ChatGPT的带动效果。微软Office 365软件
    收入增长14%,微软搜索和新闻广告营收同比增长10%,均超出分析师预期。
  4. 行业话语权
    可以将MaxKB融入客户现有产品,产品做得好,市场份额就会提升,越是就有行业话语权,就可以制定这个行业的规则。所以大家看到,现在为什么大语言模型那么火,因为各家公司都在争先入局,入局越早取得的市场份额可能就越大,就越有制定这个行业规则的话语权,比如美团在外卖行业就是一个规则的制定者,能够获取丰厚的利润。
  5. 个人生产力的提升
    不管是生活还是工作中,比如在工作中我是一名财务,我在使用ERP系统执行某个业务流程,但是由于这个流程操作的比较少,忘记怎么操作了,这时候我们是不是可以询问MaxKB让他告诉我们怎样的操作步骤和流程。
  • 16
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值