- 博客(960)
- 收藏
- 关注
原创 RAG技术全面解析:Langchain4j如何实现智能问答的跨越式进化?
RAG 是一种在将提示词发送给 LLM 之前,从你的数据中找到并注入相关信息的方式。这样,LLM 希望能获得相关的信息并利用这些信息作出回应,从而减少幻觉概率。
2024-10-07 14:46:43
954
原创 【新书】利用先进的生成式 AI 技术(如 RAG),释放数据的潜力,推动创新并获取战略优势
生成式 AI 正在帮助组织以新的方式挖掘数据潜力,检索增强生成(RAG)技术结合了大型语言模型(LLM)与内部数据,从而实现更智能且相关性更高的 AI 应用。本书的作者结合了他十年机器学习的经验,为您提供在使用 RAG 推动变革性成果时所需的战略见解和技术专长。
2024-10-06 09:53:51
1133
原创 上海交大出品:动手学大模型LLM教程,轻松突破,快速入门LLM大模型
就在4月份上交大发布了动手学大模型教程,这份教程来自上海交大 **《人工智能安全技术》** 课程讲义拓展,教师是是张倬胜教授。
2024-10-05 12:15:00
317
原创 大模型书籍推荐丨这本LLM大模型黑书你一定要学
今天给大家推荐一本丹尼斯·罗斯曼(Denis Rothman)编写的关于大语言模型(LLM)权威教程!Google工程总监Antonio Gulli作序,这含金量不用多说,在这里给大家强烈推荐一下这本黑书,下面直接开始介绍!
2024-10-04 14:15:00
1308
原创 大模型书籍推荐丨入门LLM大模型必读《大模型应用开发极简入门》附PDF
这本书是 O'Reilly 出版的,两位共同作者是来自 Worldline 公司的机器学习研究员 Olivier Caelen 和 数据工程师 Marie-Alice Blete。这两位作者一位侧重学术,一位侧重工程。在我看到本书之时,两位作者的背景信息,再加上 GPT-4 和 ChatGPT 这样的大模型前沿内容,就让我感觉非常值得一读。
2024-10-03 09:15:00
812
原创 大模型应用开发:编写插件获取实时天气信
我将带你一起探索如何利用OpenAI API开发GPT应用。无论你是编程新手还是资深开发者,都能在这里获得灵感和收获。
2024-10-02 07:15:00
935
原创 大模型应用开发:手把手教你部署并使用清华智谱GLM大模型
本文就来分享下我的安装部署经验,包括本地和租用云服务器的方式,以及如何通过API调用大模型开发自己的AI应用,希望能解决一些下不去手的问题。
2024-10-01 10:00:00
839
原创 大模型项目推荐丨《开源大模型食用指南》全网发布,轻松助你速通llm大模型!
《开源大模型食用指南》 是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。
2024-09-30 10:38:30
943
原创 大模型行业报告丨《量子计算发展态势研究报告(2024年)》
2024年9月25日,在2024中国国际信息通信展览会(PT展)上,中国信息通信研究院(简称“中国信通院”)、中移(苏州)软件技术有限公司和北京玻色量子科技有限公司联合发布《量子计算发展态势研究报告(2024年)》。中国信通院技术与标准研究所王敬对报告进行了解读。
2024-09-26 17:07:00
914
原创 生成式人工智能和大语言模型:自然语言处理与生成对抗网络
生成式人工智能(GAI)和大语言模型(LLM)是以无监督或半监督方式运行的机器学习算法。这些算法利用现有内容,如文本、照片、音频、视频和代码,生成新内容。其主要目标是生成真实且新颖的材料。
2024-09-26 17:04:58
1036
原创 通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践
通义千问1.5在先前发布1.0版本模型的基础上进行了大幅更新,主要体现在如下三个方面:多语言能力提升:Qwen1.5在多语言处理能力上进行了显著优化,支持更广泛的语言类型和更复杂的语言场景。人类偏好对齐:通过采用直接策略优化(DPO)和近端策略优化(PPO)等技术,增强了模型与人类偏好的对齐度。长序列支持:所有规模的Qwen1.5模型均支持高达32768个tokens的上下文长度,大幅提升了处理长文本的能力。在性能评测方面,Qwen1.5在多项基准测试中均展现出优异的性能。
2024-09-25 16:16:54
699
原创 通义千问!Qwen2大模型微调入门实战(完整代码)
该教程介绍了如何使用Qwen2,一个由阿里云通义实验室研发的开源大语言模型,进行指令微调以实现文本分类。
2024-09-25 16:04:50
1209
原创 2024最新大模型大厂面试八股(含100道问题+答案)
最近秋招正在如火如荼地进行中,看到很多人的简历上都包含大模型相关的工作,各家大厂和初创都很舍得给钱,动辄百万年包也变得不再稀奇。在大模型纵横的这个时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。
2024-09-23 20:27:55
820
原创 强烈建议收藏!从零开始学PyTorch ( 附上试读!)
这是一本开源的书籍,目标是帮助那些希望和使用 PyTorch 进行深度学习开发和研究的朋友快速入门,其中包含的。由于本人水平有限,在写此教程的时候参考了一些网上的资料,在这里对他们表示敬意,我会在每个引用中附上原文地址,方便大家参考。这是一本开源的书籍,目标是帮助那些希望和使用 PyTorch 进行深度学习开发和研究的朋友快速入门。深度学习的技术在飞速的发展,同时 PyTorch 也在不断更新,且本人会逐步完善相关内容。由于 PyTorch 版本更迭,教程的版本会与 PyTorch 版本,保持一致。
2024-09-23 20:12:23
714
原创 Cupshe北美市场沙滩装的领导品牌:大模型算法方向的招聘贴
Cupshe是北美市场沙滩装的领导品牌,是亚马逊目前最大的beachwear brand seller,也是Shopify全球全品类前15的品牌商店。
2024-09-20 20:26:05
1283
原创 使用Ollama本地部署Llama 3.1大模型
2024 年 7 月 24 日,Meta 宣布推出迄今为止最强大的开源模型——Llama 3.1 405B,Llama 3.1 405B 支持上下文长度为 128K Tokens, 增加了对八种语言的支持,号称第一个在常识、可操纵性、数学、工具使用和多语言翻译方面与顶级人工智能模型相媲美的模型。
2024-09-16 11:00:00
996
原创 LLM下半场之Agent基础能力概述:Profile、Memory、Plan、Action、Eval学习笔记
Agent的概念是创造一个个场景的智能体,可以在某些领域,比如在社会分析、电商导购、工业制造方面提供解决方案。LLM的发展将会让Agent的诞生成为可能,也会推动各个领域的Agent发展,所以我说Agent将会是LLM的下半场。
2024-09-14 09:38:49
1117
原创 Prompt提示词调优工具介绍-ChainForge
在人工智能和自然语言处理领域,大型语言模型(LLM)的兴起为各行各业带来了巨大变革。然而,如何有效地评估和优化这些模型的输出一直是一个挑战。为了解决这个问题,来自哈佛大学人机交互实验室的研究人员开发了ChainForge - 一个开源的可视化工具包,旨在简化提示词工程及评估测试的过程。
2024-09-14 09:19:43
763
原创 大模型书籍丨人大赵鑫教授出书《大语言模型》,第一本中文大语言模型教程!
今年4月中旬, 人大赵鑫教授出书了《大语言模型》一书, 作为第一本中文大语言模型教程, 立刻引起广泛关注, 该书内容偏综述性, 非常系统性地介绍了大语言模型的基本原理、核心技术和研究进展, 对于了解大语言模型的全貌会有非常好的帮助。
2024-09-12 14:39:14
858
原创 大模型书籍丨Dennis Rothman 大模型黑书无敌!强烈推荐
大模型黑书,Dennis Rothman的大作。 就是下图这本书,出版后受到很多赞誉,也是很多人都推荐的读物。
2024-09-12 14:33:44
309
原创 《开源大模型食用指南》,一杯奶茶速通大模型!新增Examples最佳实践!
Self-llm 开源项目是一个围绕开源大模型、针对国内初学者、适合中国宝宝的专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。
2024-09-09 14:14:40
875
原创 大语言模型应用指南:以GPT为起点,从入门到精通的AI实践教程
在20世纪末和21世纪初,人类经历了两次信息革命的浪潮。然而,随着技术的不断演进和人类社会的不断发展,我们正站在另一个信息时代的门槛上。这是一个更加智能化、更加联系紧密的时代,它将重新定义我们与世界互动的方式,塑造我们的生活、工作和社会关系。2022年11月30日,OpenAI发布了ChatGPT⸺一个基于生成式预训练Transformer (Generative Pre-trained Transformer,GPT)技术的语言模型。
2024-09-08 08:00:00
722
原创 分享轩辕大模型的实践与应用
在人工智能的浪潮中,大模型正以其独特的方式重塑金融科技的未来。在4月26日的2024年全球机器学习技术大会上,作为度小满数据智能部总经理和技术委员会执行主席,本人有幸代表团队分享了轩辕大模型在金融行业的实践与应用。
2024-09-07 06:45:00
1525
原创 【LLM大模型】如何系统的从0到1学习大模型?相关书籍及课程那些比较好?
大模型入门不可错过的一本书,就是这本大模型界的经典畅销书 《大规模语言模型》 !系统性强,内容适合初学者,如果你想知道如何构建一个大模型应用,系统了解大模型的构建,选它准没错!
2024-09-06 14:03:01
875
原创 LLM大模型好书分析:大模型黑书优缺点客观分析!
大模型黑书,Dennis Rothman的大作。 就是下图这本书,出版后受到很多赞誉,也是很多人都推荐的读物。
2024-09-06 13:58:01
634
原创 如何系统的从0到1学习大模型?这两本大模型书籍太香了
个人比较推荐的是两本关于大模型的书:《大模型应用解决方案》和《快速部署大模型》。这两本书关于上述知识都有完整的覆盖及详细的讲解,这两本书相辅相成,前者主要围绕一系列经典Transformer模型,以项目制的方式开展知识讲解;后者则补充了大语言模型(LLM)最新的前沿技术。
2024-09-06 13:49:08
427
原创 大模型入门:Mistral 大语言模型
Mistral AI 是一家销售人工智能产品的法国公司。它由 Meta Platforms 和 Google DeepMind 的前员工于 2023 年 4 月创立。该公司于 2023 年 10 月筹集了 3.85 亿欧元,2023 年 12 月估值超过 20 亿美元
2024-09-05 14:34:40
1128
原创 LLM大语言模型应用框架介绍
大语言模型的英文全称为:Large Language Model,缩写为 LLM,也被称为大型语言模型,主要指的是在大规模文本语料上训练、包含百亿级别参数的语言模型,它用来做自然语言相关任务的深度学习模型。
2024-09-05 14:28:51
795
原创 LLM大模型应用设计思考:大模型+bi,TFlowAI如何让大模型来检索数据
TFlowAI提出了一种基于大模型的解决方案,通过理解业务、查找数据、分析处理的过程编排,实现模型自主的基于数据库的数据查询与分析。这种方法不仅降低了开发成本,还提升了使用体验。
2024-09-04 14:54:11
812
原创 随着AI产品的逐渐出现是否应该焦虑
本文将从AI对就业市场的影响、隐私与安全挑战以及如何积极利用AI带来的机遇等角度出发,探讨如何在保证安全和伦理的前提下,最大化利用AI技术的优势。
2024-09-04 14:51:19
849
原创 大模型书籍推荐丨这本大模型权威教材必看!大模型私有化部署真不难(附PDF)
《ChatGLM3大模型本地化部署、应用开发与微调》作为《PyTorch 2.0深度学习从零开始学》的姊妹篇,专注于大模型的本地化部署、应用开发以及微调等。
2024-09-02 15:37:01
944
原创 大模型agent开发之提示词选择器
有时候单一的提示词模版无法满足复杂的任务需求,因此需要结合选择器使大模型有更加准确的判断,尤其是在高度上下文依赖性的对话或生成任务时,动态的选择最合适的示例或者提示词时尤其重要。
2024-09-02 15:35:30
1042
原创 国产大模型王炸发布!API 正式免费用,第一手token白嫖分析
今日,智谱 BigModel 开放平台正式宣布:GLM-4-Flash 全部免费,同时开启限时免费微调活动。
2024-08-28 14:58:21
1115
原创 【ChatGLM】终于!智谱GLM-4-9B 支持 Ollama 部署
GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中, GLM-4-9B 在各项能力上均表现出卓越的能力。
2024-08-28 14:44:37
1416
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅