- 博客(210)
- 收藏
- 关注
原创 LLM大语言模型书籍教程推荐:《大模型时代》+《开源大模型食用指南》!附文档
LLM大语言模型书籍教程推荐:《大模型时代》+《开源大模型食用指南》!附文档
2024-10-08 15:16:11 426
原创 使用Ollama部署本地LLM:构建AI REST API的简易指南
利用Ollama本地LLM(大语言模型)搭建AI的REST API服务是一个实用的方法。下面是一个简单的工作流程。
2024-10-08 15:06:05 563
原创 对于LLM大模型,到底微调还是不微调?
在 LLM 出现之前,微调通常用于小规模模型(100M – 300M 参数)。当时,最先进的领域应用通过监督微调(SFT)构建,即使用标注数据对预训练模型进行进一步训练,以适应自己的领域和下游任务。
2024-10-07 15:24:43 1084
原创 【新书】深度学习与机器学习:推动大数据分析与管理的发展
本书探讨了人工智能 (AI)、机器学习 (ML) 和深度学习 (DL) 在推动大数据分析与管理进步中的作用。书中着重简化深度学习背后的复杂数学概念,通过直观的可视化和实际案例研究,帮助读者理解神经网络及卷积神经网络 (CNN) 等技术的工作原理。
2024-10-06 10:06:23 822
原创 不可错过!CMU最新《生成式人工智能大模型》课程:从文本、图像到多模态大模型
从生成图像和文本到生成音乐和艺术,生成模型一直是人工智能的关键挑战之一。本课程将探讨推动生成模型和基础模型(Foundation Models)最近进展的机器学习和人工智能技术。
2024-10-06 10:04:50 918
原创 大模型如何领域适配?最新《领域特定基础模型概述:关键技术、应用与挑战》
ChatGPT等基于基础模型的产品在人类语言理解方面的出色表现,促使学术界和工业界探索如何将这些模型定制化应用于特定行业和应用场景。此过程被称为领域特定基础模型的定制化,旨在解决通用模型的局限性,因为通用模型可能无法完全捕捉领域特定数据的独特模式和需求。
2024-10-05 08:15:00 707
原创 《大模型驱动的数字员工3.0建设应用白皮书》
在银行业数字化、智能化发展的过程中,数字员工成为发展数字金融的重要应用载体,正在重塑银行业的服务模式和创新能力。
2024-10-04 09:15:00 700
原创 大语言模型的知识冲突:成因、根源与展望
大语言模型在实际应用场景中经常面临知识冲突的问题,主要包括上下文 - 记忆知识冲突、多源上下文知识冲突和记忆内知识冲突。
2024-10-03 07:15:00 620
原创 如何在Spring Boot中无缝集成LangChain4j,玩转AI大模型!
如何在Spring Boot中无缝集成LangChain4j,玩转AI大模型!
2024-10-02 08:15:00 834
原创 LangChain4j炸裂!Java开发者打造AI应用从未如此简单
LangChain4j 的目标是简化将大语言模型(LLM)集成到 Java 应用程序中的过程。
2024-10-01 07:45:00 1407
原创 为什么程序员要学习大模型应用开发?
人工智能大潮已来,不加入就可能被淘汰。就好像现在职场里谁不会用PPT和excel一样,基本上你见不到。你问任何一个人问他会不会用PPT,他都会说会用,只是说好还是不好。你除非说这个岗位跟电脑完全无关。但凡说能用上电脑的,基本上都会用excel和PPT,你不会用的基本上都被淘汰了,逻辑一样。
2024-09-28 15:57:07 1169
原创 Llama3的本地部署
Llama3在Meta自制的两个24K GPU集群上进行预训练,使用15T的训练数据,其中5%为非英文数据,故Llama3的中文能力稍弱, Meta认为Llama3是目前最强的开源大模型
2024-09-27 21:33:49 785
原创 混合专家模型在大模型微调领域进展
随着大规模语言模型(LLM)的快速发展,人工智能在自然语言处理领域取得了巨大的进步。在将大模型转化为实际生产力时,不免需要针对实际的任务对大模型进行微调。
2024-09-26 17:26:43 1081
原创 【新书】从零构建大型语言模型,370页pdf
塞巴斯蒂安·拉什卡(Sebastian Raschka)是Lightning AI的研究工程师,专注于LLM研究并开发开源软件**。本书的技术编辑是大卫·卡斯韦尔(David Caswell)。塞巴斯蒂安·拉什卡从事机器学习和AI领域已有十多年。他于2022年加入Lightning AI,专注于AI和LLM研究,开发开源软件,并创作教育材料。在此之前,塞巴斯蒂安曾在威斯康星大学麦迪逊分校统计系担任助理教授,专注于深度学习和机器学习的研究。他对教育充满热情,以其畅销的开源软件机器学习书籍闻名。👉。
2024-09-23 21:18:29 530
原创 腾讯:2024年AI大模型应用发展研究报告(附58页pdf)
《2024年AI大模型应用发展研究报告》深入探讨了AI大模型在电信行业的应用前景,特别是电信运营商与云服务商在该领域的合作机会。报告指出,随着AI技术的快速发展,大模型已成为推动行业创新的关键因素。电信运营商凭借其丰富的数据资源和网络基础设施,与云服务商的技术优势相结合,共同探索AI大模型的多元化发展。
2024-09-23 21:16:10 986
原创 【阿里云PAI+团队】招大模型训练优化实习生
开发大模型训练优化引擎,解决大模型训练中的核心挑战:如何在确保模型效果的同时,通过技术创新降低训练所需的资源成本。旨在通过算法优化、系统软件优化以及软硬件协同设计,来破解这一难题。
2024-09-20 20:52:24 675
原创 面了智谱大模型算法岗,效率贼高!
最近这一两周不少互联网公司都已经开始秋招提前批面试了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。
2024-09-18 20:29:17 791
原创 AI智能体研发之路-模型篇(五):pytorch vs tensorflow框架DNN网络结构源码级对比
AI智能体研发之路-模型篇(五):pytorch vs tensorflow框架DNN网络结构源码级对比
2024-09-17 11:15:00 578
原创 AI智能体研发之路-模型篇(三):中文大模型开、闭源之争
目前国内大模型发展可以用“兵荒马乱”来形容,谁能在最后杀出重围,还需要时间去考量,下面针对开、闭源的优缺点,谈一谈个人想法。
2024-09-16 09:15:00 788
原创 AI智能体研发之路-模型篇(二):DeepSeek-V2-Chat 训练与推理实战
AI智能体研发之路-模型篇(二):DeepSeek-V2-Chat 训练与推理实战
2024-09-15 08:45:00 873
原创 AI智能体研发之路-模型篇(一):大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用
今天力荐的项目是LLaMA-Factory,我在去年8月份就开始使用这个项目进行模型部署和微调训练(fine tune),当时各家大模型仅限于推理测试,OpenAI还没有对外提供微调服务,加上这个项目部署丝滑(更新及时,不会出现环境依赖问题,代码逻辑上几乎无错误),觉得好牛啊。现在来看项目已经达到22K星,果然酒深不怕巷子香。
2024-09-14 10:44:19 893
原创 大模型书籍丨国内顶尖院校出品,非常火爆的LLM大模型入门中文书来了
最近有一本人工智能入门的书比较火,这本书集合了最新的产品、技术,并通过顶尖院校的教授书写而成。我今天阅读了第一章,感觉浅显易懂,顺便把笔记也做出来了,供大家参考。
2024-09-12 16:05:28 992
原创 大模型书籍丨绝了!哥大博士整理了一份超实战的GenAl学习路线图
宝子们,最近发现了一份巨牛逼的资源,这个资料是哥伦比亚大学的机器学习博士,把分散在全网各个角落的高质量资源聚拢在一起,梳理出的超清晰的 GenAl学习路径!!
2024-09-12 15:50:14 648
原创 大型语言模型(LLMs)是怎样“学习”的?一封给网络工程师的大模型指南
数字时代,人工智能(AI)及其相关技术正日益成为许多领域的热门话题。其中,生成式人工智能(Gen AI)和大型语言模型(LLMs)引起了广泛的兴趣和讨论。然而,尽管这些术语在科技界和专业领域中频繁出现,网络工程师对其的理解却不多。
2024-09-09 15:01:47 1256
原创 吴恩达&openAI强推课程,《面向开发者的ChatGPT提示词工程》课程视频、配套代码及笔记分享
ChatGPT 的一个挑战在于编写有效的提示词,OpenAI 创始人在去年 2 月曾在 Twitter 上表示:“精通编写提示词以与聊天机器人对话,是一项令人惊叹的高杠杆技能。”自从ChatGPT发布以来,如何撰写优质的提示词已经成为一个关键的技能门槛。熟练掌握提示词的人能够迅速让ChatGPT理解需求并有效地执行任务。
2024-09-08 08:30:00 446
原创 【包教包会】速通LLM《从头开始构建大型语言模型》pdf分享
在当今人工智能技术飞速发展的时代,大型语言模型(LLM)作为聊天机器人、文本生成和理解等应用的核心,已经成为研究和商业领域的关注焦点。尽管这些模型的应用无处不在,但对于大多数开发者来说,它们的工作原理仍然是一个黑箱,更不用说如何从头开始构建一个这样的模型了。
2024-09-07 07:30:00 284
原创 逆天20w赞!吴恩达+Open AI打造《大模型通关指南》
吴恩达老师与OpenAI合作推出的大模型系列教程,从大模型时代开发者的基础技能出发,深入浅出地介绍了如何基于大模型API和LangChain架构快速开发结合大模型强大能力的应用。
2024-09-06 15:44:17 378
原创 基于LaMA-Factory微调llama3.1-8B
大模型的训练目前主要分为Pre-training和Post-training,受限于资源算力等原因,实际工作中更多用到的是SFT。
2024-09-05 21:41:07 1320
原创 谈谈大模型必学的 Function Calling!
Function Calling,这个让大语言模型 (LLM) 如虎添翼的利器,正逐渐成为人工智能领域的一大热点。它究竟是什么?如何运作?又能为我们带来哪些改变?让我们一起深入探索 Function Calling 的奥秘,揭开其背后的“魔法”,并展望其无限的未来!
2024-09-05 21:36:20 1128
原创 LLAMA3.1 8B 本地部署并配合Obsidian建立本地AI知识管理系统
LLAMA3.1 8B 本地部署并配合Obsidian建立本地AI知识管理系统
2024-09-04 15:21:49 750
原创 大模型好书推荐丨学NLP不看这本书等于白学!一书弄懂NLP自然语言处理(附文档)
随着人工智能技术的飞速发展,自然语言处理成为了计算机科学与人工智能领域中不可或缺的关键技术之一。作为一名长期致力于人工智能和自然语言处理研究的学者,今天给大家推荐的这本《自然语言处理:大模型理论与实践》正是学NLP自然语言非常牛逼的一本书!
2024-09-02 16:03:29 444
原创 LLM大模型在人工智能领域的广泛应用与试用程度
随着人工智能技术的不断进步,大模型已成为推动行业发展的关键力量。这些模型以其庞大的数据集和复杂的算法,在多个领域展现出前所未有的能力。
2024-09-02 16:02:41 872
原创 【大模型开源教程】Llama3-Chinese-8B:专为中文打造的大语言模型,领航智能对话
LLaMA 3-Chinese 是 LLaMA 3 系列中一个专门针对中文进行优化的版本。这个版本的模型在大量中文文本上进行训练,因此在中文文本生成、理解和对话等任务上表现优异。
2024-08-28 15:55:58 1244
原创 【大模型开源教程】一大堆Llama3.1-Chinese正在袭来
Llama3.1模型已经开源,在这短短几天之内,也是出现了一些Llama3.1汉化的repo,开源社区也是相当的卷。
2024-08-28 15:52:35 1299
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人