AI大模型
文章平均质量分 86
大数据小禅
致力于大数据与人工智能算法领域,数据科学硕士,华为认证云享专家,阿里云专家博主,大数据开发工程师,期待与你共同学习成长
展开
-
【AI大模型】基于Langchain和Openai接口实现英文翻译中文应用
本专栏后续将持续更新大模型相关文章,从开发到微调到应用,需要下载好的模型包可私。🚀 欢迎小伙伴们。原创 2024-06-05 17:45:38 · 357 阅读 · 4 评论 -
【AI大模型】Embedding模型解析 文本向量知识库的构建和相似度检索
在大模型中,"embedding"指的是将某种类型的输入数据(如文本、图像、声音等)转换成一个稠密的数值向量的过程。这些向量通常包含较多维度,每一个维度代表输入数据的某种抽象特征或属性。Embedding 的目的是将实际的输入转化为一种格式,使得计算机能够更有效地处理和学习文本Embedding在自然语言处理(NLP)中,文本embedding是一个常见的概念。是将文字或短语转换成数值向量的过程。这些向量捕捉了单词的语义特征,例如意义、上下文关系等。原创 2024-05-23 11:20:43 · 1770 阅读 · 5 评论 -
【AI大模型】基于Langchain和Openai的方式编写Python代码调用GPT完成对话
LangChain 是一个开源框架,专为开发由语言模型驱动的应用而设计。它通过提供一系列组件和工具,使开发者能够创建和部署高级功能的应用程序,如文本摘要、问题解答和聊天机器人等 (I)。增强代码分析:通过对代码进行高效查询和理解,来增强代码分析和开发过程。文本摘要:利用强大的语言模型(如ChatGPT)开发能够生成精确、简洁文本摘要的应用,帮助用户快速掌握复杂文档的主要内容。问题解答应用:构建能够从各种来源(如维基百科、Notion等)提取相关答案的应用,为用户提供快速可靠的信息。原创 2024-05-18 16:39:19 · 817 阅读 · 4 评论 -
【AI大模型】从零开始运用LORA微调ChatGLM3-6B大模型并私有数据训练
ChatGLM3是智谱AI和清华大学 KEG 实验室联合发布的对话预训练模型。ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示,* ChatGLM3-6B-Base 具有在 10B 以下的基础模型中最强的性能*。ChatGLM3-6B 采用了全新设计的 Prompt 格式 ,除正常的多轮对话外。原创 2024-05-16 17:11:25 · 1742 阅读 · 8 评论 -
【AI大模型】基于ChatGLM-6b从零开始本地部署语言模型,步骤详细无坑版
ChatGLM-6B 是的一种自然语言处理模型,属于大型生成语言模型系列的一部分。"6B"在这里指的是模型大约拥有60亿个参数,这些参数帮助模型理解和生成语言。ChatGLM-6B 特别设计用于对话任务,能够理解和生成自然、流畅的对话文本。这个模型通过大量的文本数据进行训练,学习如何预测和生成语言中的下一个词,从而能够参与到各种对话场景中。原创 2024-05-08 17:35:07 · 1353 阅读 · 9 评论