2024SDU项目实训周报-01

本文讲述了团队在项目实训中负责的分工,特别关注了大语言模型(LLM)在金融问答系统中的核心功能开发,如框架选择(LangChainEmbedding)、数据库(智谱)和前端实现(Vue)。作者介绍了大语言模型的基本概念及其在金融领域的潜力,并提到了环境配置的细节。
摘要由CSDN通过智能技术生成

本周我们小组经过讨论初步确定了现阶段的分工和任务,开始着手准备工作。

在本次项目实训中,我主要负责框架开发,语言模型接入,前端实现和web组件优化。

本周我主要学习了大模型开发的步骤和流程,尝试了环境配置、项目搭建。


一、大型语言模型(LLM)概念

大语言模型(LLM,Large Language Model),也称大型语言模型,是一种旨在理解和生成人类语言的人工智能模型

LLM 通常指包含数百亿(或更多)参数的语言模型,它们在海量的文本数据上进行训练,从而获得对语言深层次的理解。目前,国外的知名 LLM 有 GPT-3.5、GPT-4、PaLM、Claude 和 LLaMA 等,国内的有文心一言、讯飞星火、通义千问、ChatGLM、百川等。

为了探索性能的极限,许多研究人员开始训练越来越庞大的语言模型,例如拥有 1750 亿参数的 GPT-3 和 5400 亿参数的 PaLM 。尽管这些大型语言模型与小型语言模型(例如 3.3 亿参数的 BERT 和 15 亿参数的 GPT-2)使用相似的架构和预训练任务,但它们展现出截然不同的能力,尤其在解决复杂任务时表现出了惊人的潜力,这被称为“涌现能力”。以 GPT-3 和 GPT-2 为例,GPT-3 可以通过学习上下文来解决少样本任务,而 GPT-2 在这方面表现较差。因此,科研界给这些庞大的语言模型起了个名字,称之为“大语言模型(LLM)”。LLM 的一个杰出应用就是 ChatGPT ,它是 GPT 系列 LLM 用于与人类对话式应用的大胆尝试,展现出了非常流畅和自然的表现。


二、开发细节

确定目标:

在进行开发前,我们首先需要确定开发的目标,即要开发一款面向金融工作者和投资者以及金融爱好者和初学者的智能金融问答分析大模型系统。

核心功能:

1、 上传文档、创建知识库

2、 选择知识库,检索用户提问的相关片段

3、 提供专业的金融解读和分析,获取大模型回答

4、 历史对话记录

5、web UI

确定技术架构和工具:
框架:LangChain
Embedding模型:智谱
数据库:Chroma
大模型:GLM 

前端与用户交互界面开发:
  1. 使用 Vue 搭建前端界面。
  2. 实现用户上传文档、创建知识库的功能。
  3. 设计用户界面,包括问题输入、知识库选择、历史记录展示等。

 三、前端开发

在vscode中进行了vue开发的环境配置

  • 8
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值