自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(121)
  • 收藏
  • 关注

原创 LLM大模型:关于Llama 3 AI大模型的几点总结

Llama3 在MMLU(学科知识理解)、GPQA(一般问题)、HumanEval(代码能力)、GSM-8K(数学能力)、MATH(比较难得数学)五个基准测试上,不管是Llama3-8B,还是Llama-70B,都优于目前比较优秀的大模型。

2024-07-17 15:08:10 453

原创 LLM大模型:通过7大指标监测并评估大语言模型的表现

自然语言处理(Natural Language Processing)领域在大语言模型(LLM)的使用下迅速发展。因为其出色的文本生成和理解能力,LLM 已在全球范围内得到广泛应用。

2024-07-17 15:03:03 477

原创 LLM大模型:微调语言模型前,需要考虑这三个关键方面

目前,市场正处于LLMs(大语言模型)和生成式人工智能的风口上。IBM的一项数据显示,将近三分之二的企业高管感受到了来自投资者的压力——要求他们加快使用生成式人工智能。

2024-07-17 15:01:54 834

原创 【大模型入门】中国人工智能大模型技术白皮书,从0入门大模型,附文档+LLM实战教程

近期,中国人工智能学会发布了《中国人工智能大模型技术白皮书》,系统梳理了大模型技术演进,深入探讨关键技术要素,并剖析当前挑战及未来展望。 我为大家做了简要总结,并附上文档分享给大家。

2024-07-17 10:25:03 480

原创 AI产品经理的工作流程与现有产品经理的区别

与互联网传统的产品经理不同,AI产品经理的能力要求、门槛等相对会更高。本文作者梳理了AI产品经理的工作流程与现有产品经理的区别,可以帮助大家更好理解这个岗位。

2024-07-16 16:17:16 252

原创 【ai大模型】基于LangChain构建RAG应用

Streamlit是一个开源的 Python 库,它使得数据科学家和开发者能够快速构建和共享美观的机器学习模型和数据应用程序。使用Streamlit,用户无需深入了解前端开发,即可创建交互式的 Web 应用。它的设计哲学是简单、快速和直观,使得用户可以通过编写 Python 脚本来定义应用的布局和行为。

2024-07-16 16:15:10 714

原创 【ai大模型】聊聊大模型的屏蔽词工程

在做微调训练时,鉴于业务场景的需要,可能会存在微调数据集中含有敏感词汇,譬如:自杀、跳楼等。而开源模型可能没有做敏感词汇的屏蔽工程。因此可能就会出现不可预控的现象,而我遇到的是,当我输入敏感词汇时,模型(基于ChatGLM3)大多数时候返回空,继续正常提问,还是空的。此时模型相当于已经挂了。

2024-07-16 16:14:05 757

原创 【AI大模型】初识LangChain的快速入门指南(附入门文档)

LangChain是一个基于大语言模型用于构建端到端语言模型应用的框架,它提供了一系列工具、套件和接口,让开发者使用语言模型来实现各种复杂的任务,如文本到图像的生成、文档问答、聊天机器人等。

2024-07-15 10:21:18 1164

原创 Datawhale出品:LLM大模型《GLM-4 大模型部署微调教程》发布!

智谱 AI 发布了最新开源模型 GLM4,通过 10T 高质量多语言数据与更先进的训练技术,达到了更加出色的生成效果。

2024-07-15 10:18:24 757

原创 【AI大模型】达到1k stars后,我对大模型开源教程的反思!(附llm教程)

这个开源项目是为了提供浅显易懂且前沿的大模基础知识而打造的,能收获1k个stars⭐️也是对这个项目的肯定。我为一起付出努力的贡献者感到开心,也为这个课程的核心贡献者表达谢意。

2024-07-15 10:14:51 830

原创 【大模型】一文带你了解RAG(检索增强生成) | 概念理论介绍+ 代码实操(含源码)

针对大型语言模型效果不好的问题,之前人们主要关注大模型再训练、大模型微调、大模型的Prompt增强,但对于专有、快速更新的数据却并没有较好的解决方法,为此检索增强生成(RAG)的出现,弥合了LLM常识和专有数据之间的差距。

2024-07-13 10:31:47 646

原创 【ai大模型】在大模型RAG系统中应用知识图谱

在基于大模型的RAG应用中,可能会出现不同类型的问题,通过知识图谱的辅助可以在不同阶段增强RAG的效果,并具体说明在每个阶段如何改进答案和查询。

2024-07-13 10:30:18 979

原创 【ai大模型】为啥LLM大模型还没完全取代你?

大模型对其input和output,也就是它的输入输出有数量限制。为了保护它的,这计算能力或保护相当于一个带宽概念,如说openAI之前只有32k。最新上下文窗口扩张到128k,大概相当于一本《Clean Code》,这个角度来说,这个问题其实已被解决。

2024-07-13 10:29:39 761

原创 【LLM大模型】自主 AI Agent 的构建|Function Calling 技术实例探索

大语言模型拥有令人惊叹的语言理解和生成能力,却也存在自主决策、与外部系统交互等方面的不足。函数调用(Function Calling)技术的出现,正是为解决这一难题而生的创新方案,它赋予了大语言模型更强的自主能力和与外部世界连接的能力,成为实现真正智能自主 Agent 的关键一环。

2024-07-12 11:36:33 536

原创 【LLM大模型】一文带你了解RAG(检索增强生成) | 概念理论介绍+ 代码实操(含源码)

针对大型语言模型效果不好的问题,之前人们主要关注大模型再训练、大模型微调、大模型的Prompt增强,但对于专有、快速更新的数据却并没有较好的解决方法,为此检索增强生成(RAG)的出现,弥合了LLM常识和专有数据之间的差距。

2024-07-12 11:26:30 864

原创 LLM大模型:在RAG系统中应用知识图谱

关于大模型及其应用方面的文章层出不穷,聚焦于自己面对的问题,有针对性的阅读会有很多的启发,本文源自Whyhow.ai 上的一些文字和示例。对于在大模型应用过程中如何使用知识图谱比较有参考价值,特汇总分享给大家。

2024-07-12 11:25:56 863

原创 【LLM大模型】如何选择合适的 Embedding 模型?

检索增强生成(RAG)是生成式 AI (GenAI)中的一类应用,支持使用自己的数据来增强 LLM 模型(如 ChatGPT)的知识。

2024-07-10 10:40:21 739

原创 【LLM大模型】RAG 修炼手册|一文讲透 RAG 背后的技术

Embedding 是将离散的非结构化数据转换为连续的向量表示的技术。在自然语言处理中,Embedding 常常用于将文本数据中的单词、句子或文档映射为固定长度的实数向量,使得文本数据能够在计算机中被更好地处理和理解。通过 Embedding,每个单词或句子都可以用一个实数向量来表示,这个向量中包含了该单词或句子的语义信息。这样,相似的单词或句子就会在嵌入空间中被映射为相近的向量,具有相似语义的词语或句子在向量空间上的距离也会较近。

2024-07-10 10:36:34 995

原创 【LLM大模型】RAG 修炼手册|揭秘 RAG 时代的新向量数据库

随着对大型模型应用探索的深入,检索增强生成技术(Retrieval-Augmented Generation)受到了广泛关注,并被应用于各种场景,如知识库问答、法律顾问、学习助手、网站机器人等。

2024-07-10 10:32:08 841

原创 【LLM大模型】如何在LlamaIndex中使用RAG?

LlamaIndex 是一个数据框架,用于帮助基于 LLM 的应用程序摄取、构建结构和访问私有或特定领域的数据。

2024-07-09 11:08:22 686

原创 LLM大模型技术及趋势总结

本篇文章旨在希望大家对大模型的本质、技术和发展趋势有简单的了解。由于近期大模型技术发展很快,这里对大模型的技术、本质及未来趋势进行总结和探讨时,水平有限,疏漏在所难免,请大家谅解。

2024-07-09 10:49:08 847

原创 【AI 大模型】GPT 大模型训练架构

Transformer 架构 是 Google 设计的 , 当前最流行的 GPT 大模型 都使用的该架构 , 最著名的就是 OpenAI 的 ChatGPT 大模型

2024-07-09 10:47:13 802

原创 【LLM大模型】pytorch在有限的资源下部署大语言模型(以ChatGLM-6B为例)

pytorch在有限的资源下部署大语言模型(以ChatGLM-6B为例)

2024-07-08 13:49:27 550

原创 2024爆火全网LLM大模型教程:从零开始构建大语言模型,已突破20K star!

对GPT大模型感兴趣的有福了!这本书的名字叫 《Build a Large Language Model (From Scratch)》 也就是 从零开始构建大语言模型!

2024-07-08 13:47:25 1612

原创 LLaMA:开放和高效的基础语言模型

我们介绍了LLaMA,这是一个参数范围从7B到65B的基础语言模型集合。我们在数以万亿计的标记上训练我们的模型,并表明有可能完全使用公开可用的数据集来训练最先进的模型,而不必求助于专有的和不可获取的数据集。

2024-07-08 13:45:32 802

原创 LangChain终极内幕指南,学会langchain就看它了

在人工智能迅速演进的时代,诸如Open AI的ChatGPT和Google的Bard等大型语言模型(LLMs)正彻底改变我们与技术互动的方式。这些技术巨头和SaaS公司正在竞相利用LLMs的威力,创造更为智能和实用的应用程序。

2024-07-05 10:57:22 995

原创 【LLM大模型】LangChain从到入门到实战

LangChain是一项旨在赋能开发人员利用语言模型构建端到端应用程序的强大框架。它的设计理念在于简化和加速利用大型语言模型(LLM)和对话模型构建应用程序的过程。

2024-07-05 10:55:59 868

原创 LLM大模型时代,程序员当下如何应对 AI 的挑战

随着 AI 技术的飞速发展,特别是大模型的出现,传统的程序员角色正在经历深刻的变革,我们不得不重新对自己进行审视和思考。

2024-07-04 15:35:56 745

原创 从人工到自动化到AIOps再到ChatOps:大模型在运维领域的应用

在信息技术飞速发展的今天,运维工作已经从最初的人工操作,逐步演变为自动化、AIOps(人工智能运维)和ChatOps(通过聊天的方式去运维)。

2024-07-04 15:34:25 646

原创 一文教你读懂:LoRA实现大模型LLM微调

微调使我们能够将模型调整到目标领域和目标任务。然而,它在计算上可能非常昂贵-模型越大,更新其层的成本就越高。作为更新所有层的替代方法,已经开发了参数高效的方法,例如前缀调整和适配器。

2024-07-03 10:27:47 329

原创 基于LLM(Large Language Model,大语言模型)的智能问答系统

基于LLM(Large Language Model,大语言模型)的智能问答系统是一种利用先进的人工智能技术,尤其是自然语言处理(NLP)技术,来构建能够理解和回答用户问题的系统。这种系统通过训练大量文本数据,学习语言的规律和模式,从而能够理解和生成人类语言。

2024-07-03 10:26:18 286

原创 多模态大模型面对误导性问题:看懂图片也会答错,一骗就中招

多模态大语言模型(MLLMs)因其在视觉理解和推理方面的突出表现,例如生成详细的图像描述和回答复杂的问题等,逐渐成为近期AI研究的热点。

2024-07-02 11:57:37 853

原创 2024爆火全网的LLM大语言模型黑书!入门大模型大家全都在学~(附pdf)

今天给大家推荐一本4月份才新出的大型语言模型(LLM)的权威教程《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》!Google工程总监Antonio Gulli作序,一堆大佬推荐!这含金量不用多说,不多bb开始介绍!

2024-07-02 11:56:00 1227

原创 【LLM大模型】医疗大语言模型:CareGPT

CareGPT (关怀GPT)是一个医疗大语言模型,同时它集合了数十个公开可用的医疗微调数据集和开放可用的医疗大语言模型,包含LLM的训练、测评、部署等以促进医疗LLM快速发展。

2024-06-30 16:54:52 282

原创 Mac环境下ollama部署和体验

ollama和LLM(大型语言模型)的关系,类似于docker和镜像,可以在ollama服务中管理和运行各种LLM,下面是ollama命令的参数,与docker管理镜像很类似,可以下载、删除、运行各种LLM

2024-06-30 16:47:47 467

原创 LLM大模型提示工程Prompt Engineering

在LLM中影响词汇的分布主要通过两种方式,一种是通过提示(Prompting),另外一种就是通过训练(Training)。提示是影响词汇分布最简单的方法,通过给LLM输入提示文本(有时会包含指令和示例)使得词汇的分布概率发生变化。

2024-06-29 15:04:30 801

原创 【LLM大模型】一本书通关LLM大模型!成功通关大模型,看这本书足够了... (附PDF)

哈喽大家好!最近有粉丝朋友喊我推荐一些大模型的学习书籍,我给大家推荐这么一本书,基于gbt3、gbt4等transform架构的自然语言处理。

2024-06-29 15:00:39 1686

原创 AI大模型全栈工程师课程笔记 - LangChain (文末福利)

AI大模型全栈工程师课程笔记 - LangChain (文末福利)

2024-06-28 16:16:26 882

原创 LangChain:打造自己的LLM应用

随着LLM的技术发展,其在业务上的应用越来越关键,通过LangChain大大降低了LLM应用开发的门槛。本文通过介绍LangChain是什么,LangChain的核心组件以及LangChain在实际场景下的使用方式,希望帮助大家能快速上手LLM应用的开发。

2024-06-28 16:12:58 1021

原创 七天入门LLM大模型 | 3:LLM和多模态模型高效推理实践

Xinference支持大语言模型,语音识别模型,多模态模型的部署,简化了部署流程,通过一行命令完成模型的部署工作。作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。LLM会产生误导性的 “幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏专业领域的深度洞察,同时在推理能力上也有所欠缺。使用ModelScope NoteBook完成语言大模型,视觉大模型,音频大模型的推理。

2024-06-28 07:45:00 645

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除