自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(234)
  • 收藏
  • 关注

原创 重磅消息!《大模型实战宝典》(2024版) 正式发布!

2024 年刚开年,OpenAI 推出的文生视频工具 Sora 再次风靡全球,成为 OpenAI 继 ChatGPT 之后新的生成式 AI 标杆。关于大模型的话题不断涌现,令人应接不暇,截至到目前,国内大模型已发布数量超过200个。去年我们写了一本《大模型实战宝典》(以下简称《实战宝典》),有很多小伙伴订阅,反馈内容通俗易懂,有基础知识做铺垫,收获了很多。今年年初开始,就开始计划内容大版本升级,前期也做了很多准备工作。

2024-03-23 09:04:57 684

原创 重磅消息!《大模型面试宝典》(2024版) 正式发布!

2022 年11月底,OpenAI 正式推出 ChatGPT ,不到两个月的时间,月活用户就突破1亿,成为史上增长最快的消费者应用。目前国内已发布的大模型超过200个,大模型的出现彻底改变了我们的生活和学习方式。现在只要你想从事 AI 相关的岗位,无论是计算机视觉(CV)、自然语言处理(NLP)、搜广推、风控等,大模型相关话题都是绕不开的。节前,我们星球群组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、最近参加社招和校招面试的同学。

2024-03-23 09:01:30 1184

原创 熬了一个通宵,把国内外的大模型都梳理完了!

大家好,大模型越来越多了,真的有点让人眼花缭乱。为了让大家清晰地了解大模型,我熬了一个通宵把国内和国外的大模型进行了全面梳理,国内有189个,国外有20+,同时包括大模型的来源机构、来源信息和分类等。如果你想参与我们技术讨论、前沿技术分享,请加入我们。

2023-12-17 21:33:25 446

原创 整理了上百个开源中文大语言模型,涵盖模型、应用、数据集、微调、部署、评测

自ChatGPT为代表的大语言模型(Large Language Model, LLM)出现以后,由于其惊人的类通用人工智能(AGI)的能力,掀起了新一轮自然语言处理领域的研究和应用的浪潮。尤其是以ChatGLM、LLaMA等平民玩家都能跑起来的较小规模的LLM开源之后,业界涌现了非常多基于LLM的二次微调或应用的案例。本项目旨在收集和梳理中文LLM相关的开源模型、应用、数据集及教程等资料,目前收录的资源已达100+个!

2023-12-17 16:07:38 2392

原创 行业大模型训练经验分享&落地思考

最后共勉:BERT时代况且还在用TextCNN,难道13B的模型就不叫大模型吗?

2023-12-14 23:47:32 482

原创 PyTorch 模型训练性能大揭秘:从基础到高级技巧一网打尽!

PyTorch 是一个开源的 Python 机器学习库,基于Torch,用于自然语言处理等应用程序。PyTorch既可以看作加入了GPU支持的numpy,也可以看成一个拥有自动求导功能的强大的深度神经网络,同时它也是大模型开发的首选工具。《PyTorch模型训练性能调优宝典》是解决PyTorch训练性能和效率问题的首选宝典。包括:AI/ML平台工程师、数据平台工程师、后端软件工程师、MLOps工程师、站点可靠性工程师、架构师、机器学习工程师以及任何希望掌握PyTorch性能调优技巧的专业人士。

2023-12-14 22:03:06 345

原创 LoRA 微调大模型的实践经验总结

在深度学习领域,特别是在大型语言模型(LLM)领域,模型的大小导致更新模型权重的成本非常高。假设我们有一个含有70亿参数的LLM,这些参数被表示在一个权重矩阵W中。在训练中,为了最小化损失函数,我们会计算一个ΔW矩阵,里面包含了对原始权重的更新信息。通常的权重更新过程如下:如果权重矩阵W包含70亿参数,那么权重更新矩阵ΔW也将包含70亿参数,计算ΔW将消耗巨大的计算和内存资源。为了解决这一问题,Hu等人提出了LoRA方法,该方法通过分解权重变化ΔW到一个低秩表示。

2023-12-12 22:29:09 732

原创 使用 PyTorch 完全分片数据并行技术加速大模型训练

本文,我们将了解如何基于 PyTorch 最新的功能用库来训练大模型。

2023-12-11 22:51:52 352 1

原创 基于 LangChain 的优秀项目资源库

精选的使用 LangChain 的工具和项目列表。在AI盛起的当下,各类AI应用不断地出现在人们的视野中,AI正在重塑着各行各业,LangChain 是从事AI应用开发的人员或多或少都会接触到的框架。LangChain是一个令人惊叹的框架,可以在极短的时间内完成LLM项目,其生态系统正在快速发展。

2023-12-09 11:13:00 1162

原创 LangChain+通义千问+AnalyticDB向量引擎保姆级教程

1.创作文字,如写故事、写公文、写邮件、写剧本、写诗歌等;2.编写代码;3.提供各类语言的翻译服务,如英语、日语、法语、西班牙语等;4.进行文本润色和文本摘要等工作;5.扮演角色进行对话;6.制作图表等。如果直接使用通义千问API从0到1来构建应用,技术成本还是相对比较高的。幸运的是,当前已经有非常优秀的框架LangChain来串联AIGC相关的各类组件,让我们轻松构建自己的应用。

2023-12-08 23:37:14 779

原创 使用大模型框架 LlamaIndex ,释放多文档代理的强大功能

在深入探讨之前,让我们澄清一些关键概念:多文档代理(MDAs):这些智能系统能够处理并综合来自多个文档的信息,以提供对用户查询的全面响应。LlamaIndex:这是一个先进的平台,促进文档索引和检索,作为构建强大MDAs的支撑。多文档代理与LlamaIndex的优势全面的信息检索:通过利用跨多个文档的集体知识,由LlamaIndex支持的MDAs可以为用户提供更全面和准确的响应。这确保了更丰富的用户体验,并促进了更深入的理解。

2024-04-30 17:12:18 406

原创 大模型实战:如何使用图数据库提高向量搜索精确度?

在这篇博客文章中,我们实现了基于图的元数据过滤器的示例,以提高向量搜索的准确性。数据集拥有广泛且相互关联的选项,这允许进行更精细的预过滤查询。结合图数据表示和语言模型的函数调用功能,可以动态生成 Cypher 语句,从而为结构化过滤器提供了几乎无限的可能性。此外,你的代理可以拥有检索非结构化文本的工具,如本文所示,以及能够检索结构化信息的其他工具,这使得知识图谱成为许多 RAG应用的理想解决方案。

2024-04-30 17:07:10 521

原创 【完整指南】如何在Visual Studio Code中轻松运行Llama 3模型?

Meta 发布了最新的开源语言模型Llama 3。因为它是开源的,你可以下载这个模型,并在自己的电脑上运行。我清楚,你可能会想,在个人笔记本上运行一个拥有80亿参数的AI模型似乎只有技术高手才能做到。但别担心!这篇文章会提供一个简单的步骤指导,帮助每个人都能轻松上手。

2024-04-28 11:32:39 621

原创 向量数据库深度比较:为何 Qdrant 是您的最佳选择?

我们生活的世界中,数据往往是复杂且无规则的,不是所有信息都能简单地适应传统的行列模式。特别是当我们处理图像、视频和自然语言这样的复杂非结构化数据时,向量数据库就显得尤为重要了。向量数据库,顾名思义,它以高维向量的形式存储数据。这些向量是一串数字,代表了某个对象的特征或属性。每一个向量都对应着一个独一无二的实体,比如一段文字、一张图片或一段视频。为什么选择向量呢?向量的魅力在于它们能够精准捕捉到数据的语义含义和相似度。

2024-04-28 11:07:14 671

原创 解锁大模型高效推理:将 LlamaIndex 与抽象链集成

在语言理解领域,对忠实推理的追求促使研究人员探索各种途径。大型语言模型(LLMs)在解释和执行指令方面取得了显著进展,但在准确回忆和组合现实世界知识方面仍然面临挑战。为了解决这个问题,将外部工具集成到LLMs的推理过程中已经成为一种有前途的方法。虽然工具可以通过提供对外部知识源的访问来促进这一过程,但有效地将它们整合到多步推理任务中仍然是一个挑战。相互连接的工具调用需要对工具的有效使用进行整体规划,促使探索新的方法论来增强LLMs的推理能力。

2024-04-28 10:49:29 688

原创 上周面了一个大模型算法岗的女生,有点崩溃。。。

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。又是一年金三银四,不同以往的是,当前的职场环境已经不再是那个双向奔赴的美好时代了。求职者在变多,HC 在变少,岗位要求还更高了,面对这样的困境,我们应该如何突围值得每个人去思考。最近组内一直在招人,上周就面了一个做大模型算法岗的女生,让我很崩溃!

2024-04-24 22:04:11 1115

原创 Llama3 中文通用 Agent 微调模型来啦!(附手把手微调实战教程)

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。Llama3模型在4月18日公布后,国内开发者对Llama3模型进行了很多训练和适配,除了中文纯文本模型外,多模态版本也陆续在发布中。考虑到国内用户对Agent场景的需求,社区LLM&AIGC模型微调推理框架SWIFT基于Llama3-8b-instruct原始版本训练了。

2024-04-24 21:53:20 1237

原创 玩转 AIGC!使用 SD-WebUI 实现从文本到图像转换

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。stable-diffusion-webui是一个很棒的开源项目,它是一款基于web的GUI应用,让用户能够方便地与 stable-diffusion模型进行交互,选择不同的模型,并实现从文本到图像(txt2img)的以及其他图像处理任务。

2024-04-22 22:31:29 1725

原创 万字长文梳理Llama开源家族!从Llama-1到Llama-3

总之,Llama模型的发布不仅证明了开源模型在全球AI领域的重要性,也为AI的未来发展方向提供了新的视角和动力。通过持续的技术进步和社区驱动的创新,Llama有望继续推动全球AI技术的广泛应用和发展。

2024-04-22 22:12:54 812

原创 面试被问懵了:手撕 Transformer

如果你还没刷面试题?想看最新面经和答案?那得赶紧加入求职群!最新校招、实习、社招、教职信息、大厂面经和企业内推全都有!强烈建议大家加入2024年求职群(主要面向25届、26届及之后的同学)!

2024-04-20 20:47:01 707

原创 基于 LLM 大模型 Agent 的实践总结和困境分享

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。本文提到大模型通常的工作方式,即通过提示词进行问答,并指出了两个主要问题:历史对话信息的管理和令牌数量的限制。文章讨论知识库问答和个人助手两个应用场景,并分析了各自面临的困境,如知识库无法有效处理多模态信息和大型文档,个人助手则受限于工具参数的复杂性和令牌长度。

2024-04-20 20:33:06 1018

原创 Llama 3 开源!手把手带你进行大模型推理,部署,微调和评估

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。近日,Meta发布了 Meta Llama 3系列,是 LLama 系列开源大型语言模型的下一代。在接下来的几个月,Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能,并会分享 Llama 3 研究论文。

2024-04-20 20:14:08 2917 1

原创 用通俗易懂的方式讲解:大模型高级 RAG 检索策略之递归检索

递归检索相较于普通 RAG 检索,可以解决后者因文档切片过大而导致检索信息不准确的问题,下面是递归检索的流程图:递归检索在原始文档节点基础上,扩展了更多粒度更小的文档节点检索文档时如果检索到扩展节点,会递归检索到其原始节点,然后再将原始节点做为检索结果提交给 LLM在LlamaIndex[1]的实现中,递归检索主要有两种方式:块引用的递归检索和元数据引用的递归检索。

2024-04-14 10:43:36 995

原创 小米暑期实习NLP算法工程师面试题8道|含解析

Bert(Bidirectional Encoder Representations from Transformers)是一种基于Transformer架构的预训练语言表示模型。与传统的基于循环神经网络的语言模型不同,Bert利用了Transformer的自注意力机制,能够在处理语言任务时更好地捕捉上下文信息。Bert的预训练过程包括两个阶段:Masked Language Model(MLM)和Next Sentence Prediction(NSP)。

2024-04-14 10:34:00 1128

原创 【RAG实践】Rerank,让大模型 RAG 更近一步

近几年, 随着深度学习的发展,尤其是预训练语言模型的出现极大的推动了文本表示技术的效果, 基于预训练语言模型的文本表示模型在学术研究数据、工业实际应用中都明显优于传统的基于统计模型或者浅层神经网络的文本表示模型。本文主要关注在Rerank,本文中,Rerank可以在不牺牲准确性的情况下加速LLM的查询(实际上可能提高准确率),Rerank通过从上下文中删除不相关的节点,重新排序相关节点来实现这一点。加载数据后,基于文档对象列表(或节点列表),建设他们的index,就可以方便的检索他们。

2024-04-09 22:21:31 1225

原创 【RAG实践】基于LlamaIndex和Qwen1.5搭建基于本地知识库的问答机器人

LLM 会产生误导性的 “幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏专业领域的深度洞察,同时在推理能力上也有所欠缺。正是在这样的背景下,检索增强生成技术(Retrieval-Augmented Generation,RAG)应时而生,成为 AI 时代的一大趋势。RAG 通过在语言模型生成答案之前,先从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过程,极大地提升了内容的准确性和相关性。

2024-04-09 22:14:11 1335

原创 网易大模型 RAG 问答知识库开源,Star 超 6K!!

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天我分享一个开源项目QAnything,它是由网易开源自研的 RAG 引擎。该引擎允许用户上传 PDF、图片、Word、Excel、PowerPoint 等多种格式的文档,并实现类似于 ChatGPT 的互动问答功能,其中每个答案都能精确追溯到相应的文档段落来源。

2024-04-05 13:06:27 1420

原创 理想大模型实习面试题6道(答案解析)

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。最大的感受就是,今年的算法面试题普遍反馈特别的新!AIGC 相关的面试题猛增,特别是去年到今年爆火的大模型、多模态、扩散模型、SAM等考察的知识点越来越多。今天分享社群中一位面试理想大模型(实习)的面试题,希望对大家找工作有帮助,

2024-04-05 12:51:36 1078

原创 得物 AIGC 算法岗(日常实习生) 面经分享

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。最大的感受就是,今年的算法面试题普遍反馈特别的新!AIGC 相关的面试题猛增,特别是去年到今年爆火的大模型、多模态、扩散模型、SAM等考察的知识点越来越多。3.19 面了40分钟,今天第三场面试了,中午还开了个会,面完我感觉嗓子都哑了。

2024-03-30 16:48:29 1992

原创 阿里通义千问 Qwen1.5-MoE 开源!推理训练最佳实践教程来啦

通义千问团队推出 Qwen 系列的首个MoE模型,Qwen1.5-MoE-A2.7B。它仅拥有27亿个激活参数,但其性能却能与当前最先进的70亿参数模型,如Mistral 7B和Qwen1.5-7B相媲美。

2024-03-30 16:40:27 2126

原创 面了美团大模型算法岗(实习),被问傻了。。。。

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。最大的感受就是,今年的算法面试题普遍反馈特别的新!AIGC 相关的面试题猛增,特别是去年到今年爆火的大模型、多模态、扩散模型、SAM等考察的知识点越来越多。比如 YOLOv9 刚出,肯定得立马学习上,哪怕不用,但问到相关知识点了,如果答不上来那损失太大了。比如 YOLOv9 和 v8 的区别。

2024-03-26 14:28:16 983

原创 阿里通义千问 Qwen1.5 实践案例来了

大模型落地一直受到算力的约束,今天分享一个参数相对较小的模型: Qwen1.5 的落地方法。

2024-03-23 11:14:36 1401

原创 大模型面试题最全总结,没有一道是送分题。。。

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天分享大模型面试相关知识点,持续更新,希望对后续找工作的有所帮助。数据预处理->分块(这一步骤很关键,有时候也决定了模型的效果)->文本向量化->query向量化->向量检索->重排->query+检索内容输入LLM->输出克服遗忘问题提升回答的准确性、权威性、时效性。

2024-03-19 22:50:24 837

原创 高效复现类 Sora 视频生成方案开源!Open-Sora 最佳实践教程来啦!

近期,HPC-AI Tech团队在GitHub上正式公开了Open-Sora项目(https://github.com/hpcaitech/Open-Sora),该项目致力于复现OpenAI的Sora模型核心技术,并已取得实质性进展。作为开源社区内的开创性工作,Open-Sora 率先提供了全球首个类Sora视频生成方案。我们也迅速跟进并深入学习了这一研究成果,以期促进技术交流与应用落地。喜欢这一块的小伙伴可以加入我们社群讨论,

2024-03-19 22:19:56 1740

原创 用通俗易懂的方式讲解:大模型 Rerank 模型部署及使用技巧总结

RAG 是一种结合了信息检索和文本生成的语言模型技术。简单来说,当你向大语言模型(LLM)提出一个问题时,RAG 首先会在一个大型的文档集合中寻找相关信息,然后再基于这些信息生成回答。Rerank 的工作就像是一个智能的筛选器,当 RAG 从文档集合中检索到多个文档时,这些文档可能与你的问题相关度各不相同。有些文档可能非常贴切,而有些则可能只是稍微相关或者甚至是不相关的。这时,Rerank 的任务就是评估这些文档的相关性,然后对它们进行重新排序。它会把那些最有可能提供准确、相关回答的文档排在前面。

2024-03-12 21:47:46 3247

原创 神仙打架!秋招面了十多家,成功拿下虾皮offer

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天分享粉丝群一文,希望对后续找工作的有所帮助。更多技术交流&面经学习,可以文末加入我们交流群。

2024-03-12 21:40:57 1107

原创 2024年,算法岗哪个方向更有前景

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天给大家分享一下我的心得,希望对后续找工作的有所帮助。这几年AI风口变的太快了,有个粉丝后台私信我,问我:刚研一,后面想做算法岗,哪个方向最好就业。算法岗方向确实多:传统NLP、CV、搜推广、大模型、风控、自动驾驶甚至包括量化等等。今天花十分钟简单讲讲这个问题。

2024-03-12 11:20:16 1091

原创 推荐收藏!百度算法工程师(大模型方向)被问了这10道面试题(含解析)

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天我整理一下百度算法岗面试题,分享给大家,希望对后续找工作的有所帮助。Lora方法指的是在大型语言模型上对指定参数增加额外的低秩矩阵,也就是在原始PLM旁边增加一个旁路,做一个降维再升维的操作。并在模型训练过程中,固定PLM的参数,只训练降维矩阵A与升维矩阵B。

2024-02-27 21:50:57 1068

原创 【算法岗】腾讯、美团、百度、华为等面试复盘来了

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天我整理一下一位社群粉丝的算法岗面试题,分享给大家,希望对后续找工作的有所帮助。现在距离秋招结束也好长一段时间了,今天总结一下自己在秋招中的一些经验和教训,希望可以帮助到学弟学妹们。先介绍一下我自己的情况,我本科211,硕士985,软件工程专业。

2024-02-27 21:14:15 1033

原创 推荐收藏!科大讯飞算法岗(NLP 方向)面试题7道(含答案)

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天我整理一下算法岗方向面试题,分享给大家,希望对后续找工作的有所帮助。

2024-02-26 22:19:27 1240

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除