- 博客(913)
- 收藏
- 关注
原创 大模型应用开发:手把手教你部署并使用清华智谱GLM大模型
本文就来分享下我的安装部署经验,包括本地和租用云服务器的方式,以及如何通过API调用大模型开发自己的AI应用,希望能解决一些下不去手的问题。
2024-10-01 10:00:00 509
原创 大模型项目推荐丨《开源大模型食用指南》全网发布,轻松助你速通llm大模型!
《开源大模型食用指南》 是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。
2024-09-30 10:38:30 752
原创 大模型行业报告丨《量子计算发展态势研究报告(2024年)》
2024年9月25日,在2024中国国际信息通信展览会(PT展)上,中国信息通信研究院(简称“中国信通院”)、中移(苏州)软件技术有限公司和北京玻色量子科技有限公司联合发布《量子计算发展态势研究报告(2024年)》。中国信通院技术与标准研究所王敬对报告进行了解读。
2024-09-26 17:07:00 845
原创 生成式人工智能和大语言模型:自然语言处理与生成对抗网络
生成式人工智能(GAI)和大语言模型(LLM)是以无监督或半监督方式运行的机器学习算法。这些算法利用现有内容,如文本、照片、音频、视频和代码,生成新内容。其主要目标是生成真实且新颖的材料。
2024-09-26 17:04:58 962
原创 通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践
通义千问1.5在先前发布1.0版本模型的基础上进行了大幅更新,主要体现在如下三个方面:多语言能力提升:Qwen1.5在多语言处理能力上进行了显著优化,支持更广泛的语言类型和更复杂的语言场景。人类偏好对齐:通过采用直接策略优化(DPO)和近端策略优化(PPO)等技术,增强了模型与人类偏好的对齐度。长序列支持:所有规模的Qwen1.5模型均支持高达32768个tokens的上下文长度,大幅提升了处理长文本的能力。在性能评测方面,Qwen1.5在多项基准测试中均展现出优异的性能。
2024-09-25 16:16:54 657
原创 通义千问!Qwen2大模型微调入门实战(完整代码)
该教程介绍了如何使用Qwen2,一个由阿里云通义实验室研发的开源大语言模型,进行指令微调以实现文本分类。
2024-09-25 16:04:50 905
原创 2024最新大模型大厂面试八股(含100道问题+答案)
最近秋招正在如火如荼地进行中,看到很多人的简历上都包含大模型相关的工作,各家大厂和初创都很舍得给钱,动辄百万年包也变得不再稀奇。在大模型纵横的这个时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。
2024-09-23 20:27:55 790
原创 强烈建议收藏!从零开始学PyTorch ( 附上试读!)
这是一本开源的书籍,目标是帮助那些希望和使用 PyTorch 进行深度学习开发和研究的朋友快速入门,其中包含的。由于本人水平有限,在写此教程的时候参考了一些网上的资料,在这里对他们表示敬意,我会在每个引用中附上原文地址,方便大家参考。这是一本开源的书籍,目标是帮助那些希望和使用 PyTorch 进行深度学习开发和研究的朋友快速入门。深度学习的技术在飞速的发展,同时 PyTorch 也在不断更新,且本人会逐步完善相关内容。由于 PyTorch 版本更迭,教程的版本会与 PyTorch 版本,保持一致。
2024-09-23 20:12:23 692
原创 Cupshe北美市场沙滩装的领导品牌:大模型算法方向的招聘贴
Cupshe是北美市场沙滩装的领导品牌,是亚马逊目前最大的beachwear brand seller,也是Shopify全球全品类前15的品牌商店。
2024-09-20 20:26:05 1213
原创 使用Ollama本地部署Llama 3.1大模型
2024 年 7 月 24 日,Meta 宣布推出迄今为止最强大的开源模型——Llama 3.1 405B,Llama 3.1 405B 支持上下文长度为 128K Tokens, 增加了对八种语言的支持,号称第一个在常识、可操纵性、数学、工具使用和多语言翻译方面与顶级人工智能模型相媲美的模型。
2024-09-16 11:00:00 769
原创 LLM下半场之Agent基础能力概述:Profile、Memory、Plan、Action、Eval学习笔记
Agent的概念是创造一个个场景的智能体,可以在某些领域,比如在社会分析、电商导购、工业制造方面提供解决方案。LLM的发展将会让Agent的诞生成为可能,也会推动各个领域的Agent发展,所以我说Agent将会是LLM的下半场。
2024-09-14 09:38:49 1069
原创 Prompt提示词调优工具介绍-ChainForge
在人工智能和自然语言处理领域,大型语言模型(LLM)的兴起为各行各业带来了巨大变革。然而,如何有效地评估和优化这些模型的输出一直是一个挑战。为了解决这个问题,来自哈佛大学人机交互实验室的研究人员开发了ChainForge - 一个开源的可视化工具包,旨在简化提示词工程及评估测试的过程。
2024-09-14 09:19:43 733
原创 大模型书籍丨人大赵鑫教授出书《大语言模型》,第一本中文大语言模型教程!
今年4月中旬, 人大赵鑫教授出书了《大语言模型》一书, 作为第一本中文大语言模型教程, 立刻引起广泛关注, 该书内容偏综述性, 非常系统性地介绍了大语言模型的基本原理、核心技术和研究进展, 对于了解大语言模型的全貌会有非常好的帮助。
2024-09-12 14:39:14 797
原创 大模型书籍丨Dennis Rothman 大模型黑书无敌!强烈推荐
大模型黑书,Dennis Rothman的大作。 就是下图这本书,出版后受到很多赞誉,也是很多人都推荐的读物。
2024-09-12 14:33:44 279
原创 《开源大模型食用指南》,一杯奶茶速通大模型!新增Examples最佳实践!
Self-llm 开源项目是一个围绕开源大模型、针对国内初学者、适合中国宝宝的专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。
2024-09-09 14:14:40 848
原创 大语言模型应用指南:以GPT为起点,从入门到精通的AI实践教程
在20世纪末和21世纪初,人类经历了两次信息革命的浪潮。然而,随着技术的不断演进和人类社会的不断发展,我们正站在另一个信息时代的门槛上。这是一个更加智能化、更加联系紧密的时代,它将重新定义我们与世界互动的方式,塑造我们的生活、工作和社会关系。2022年11月30日,OpenAI发布了ChatGPT⸺一个基于生成式预训练Transformer (Generative Pre-trained Transformer,GPT)技术的语言模型。
2024-09-08 08:00:00 685
原创 分享轩辕大模型的实践与应用
在人工智能的浪潮中,大模型正以其独特的方式重塑金融科技的未来。在4月26日的2024年全球机器学习技术大会上,作为度小满数据智能部总经理和技术委员会执行主席,本人有幸代表团队分享了轩辕大模型在金融行业的实践与应用。
2024-09-07 06:45:00 1497
原创 【LLM大模型】如何系统的从0到1学习大模型?相关书籍及课程那些比较好?
大模型入门不可错过的一本书,就是这本大模型界的经典畅销书 《大规模语言模型》 !系统性强,内容适合初学者,如果你想知道如何构建一个大模型应用,系统了解大模型的构建,选它准没错!
2024-09-06 14:03:01 854
原创 LLM大模型好书分析:大模型黑书优缺点客观分析!
大模型黑书,Dennis Rothman的大作。 就是下图这本书,出版后受到很多赞誉,也是很多人都推荐的读物。
2024-09-06 13:58:01 611
原创 如何系统的从0到1学习大模型?这两本大模型书籍太香了
个人比较推荐的是两本关于大模型的书:《大模型应用解决方案》和《快速部署大模型》。这两本书关于上述知识都有完整的覆盖及详细的讲解,这两本书相辅相成,前者主要围绕一系列经典Transformer模型,以项目制的方式开展知识讲解;后者则补充了大语言模型(LLM)最新的前沿技术。
2024-09-06 13:49:08 412
原创 大模型入门:Mistral 大语言模型
Mistral AI 是一家销售人工智能产品的法国公司。它由 Meta Platforms 和 Google DeepMind 的前员工于 2023 年 4 月创立。该公司于 2023 年 10 月筹集了 3.85 亿欧元,2023 年 12 月估值超过 20 亿美元
2024-09-05 14:34:40 1079
原创 LLM大语言模型应用框架介绍
大语言模型的英文全称为:Large Language Model,缩写为 LLM,也被称为大型语言模型,主要指的是在大规模文本语料上训练、包含百亿级别参数的语言模型,它用来做自然语言相关任务的深度学习模型。
2024-09-05 14:28:51 771
原创 LLM大模型应用设计思考:大模型+bi,TFlowAI如何让大模型来检索数据
TFlowAI提出了一种基于大模型的解决方案,通过理解业务、查找数据、分析处理的过程编排,实现模型自主的基于数据库的数据查询与分析。这种方法不仅降低了开发成本,还提升了使用体验。
2024-09-04 14:54:11 795
原创 随着AI产品的逐渐出现是否应该焦虑
本文将从AI对就业市场的影响、隐私与安全挑战以及如何积极利用AI带来的机遇等角度出发,探讨如何在保证安全和伦理的前提下,最大化利用AI技术的优势。
2024-09-04 14:51:19 824
原创 大模型书籍推荐丨这本大模型权威教材必看!大模型私有化部署真不难(附PDF)
《ChatGLM3大模型本地化部署、应用开发与微调》作为《PyTorch 2.0深度学习从零开始学》的姊妹篇,专注于大模型的本地化部署、应用开发以及微调等。
2024-09-02 15:37:01 908
原创 大模型agent开发之提示词选择器
有时候单一的提示词模版无法满足复杂的任务需求,因此需要结合选择器使大模型有更加准确的判断,尤其是在高度上下文依赖性的对话或生成任务时,动态的选择最合适的示例或者提示词时尤其重要。
2024-09-02 15:35:30 994
原创 国产大模型王炸发布!API 正式免费用,第一手token白嫖分析
今日,智谱 BigModel 开放平台正式宣布:GLM-4-Flash 全部免费,同时开启限时免费微调活动。
2024-08-28 14:58:21 1027
原创 【ChatGLM】终于!智谱GLM-4-9B 支持 Ollama 部署
GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中, GLM-4-9B 在各项能力上均表现出卓越的能力。
2024-08-28 14:44:37 1204
原创 大模型如何生成可控文本?人大等最新《大型语言模型的可控文本生成》综述
在自然语言处理(NLP)领域,大型语言模型(LLMs)已展示出高质量的文本生成能力。然而,在实际应用中,LLMs必须满足日益复杂的需求。除了避免生成误导性或不恰当的内容外,LLMs还需要满足特定用户的需求,例如模仿特定的写作风格或生成具有诗意丰富性的文本。
2024-08-26 15:12:11 741
原创 8月最新大语言模型新书!赵宇教授《自然语言处理:大模型理论与实践》449页pdf!
在当今的人工智能时代,NLP技术已经深入渗透到我们日常生活的各个方面,从智能助手、语音识别到机器翻译和文本生成,NLP正在以令人瞩目的速度改变着我们的生活方式。
2024-08-26 15:08:11 414
原创 小白学大模型:GLM api调用教程
在这里,你会发现丰富的 代码示例👨、实用指南🗺️ 以及 资源链接🔗,或许能帮助你轻松掌握 GLM API 的使用!
2024-08-23 16:26:18 884
原创 小白学大模型:LLaMA-Factory 介绍与使用
LLaMA-Factory是一个统一的框架,集成了一套先进的高效训练方法。它允许用户通过内置的Web UI灵活定制100多个LLMs的微调,而无需编写代码。
2024-08-23 16:20:36 946
原创 LLaMA 3 背后的大规模 GPU 集群 RoCE 网络建设
模型越来越大,需要的 GPU 越来越多;与此同时 GPU 性能也在不断增强,配套的网络带宽也不断增加到 400G(Blackwell GPU 甚至需要到 800 Gbps)。
2024-08-22 20:27:22 883
原创 Llama 3.1对我国AIGC产业发展的启示
我国开源大模型的发展还存在一些差距和不足。因此,有必要深入研究Llama3.1的发布,探讨其对我国开源大模型发展的启示。
2024-08-22 20:22:19 694
原创 如何优化ChatGLM-6B?一行代码就行 | 最“in”大模型
ChatGPT 的横空出世开启了大语言模型 (LLM) 的普及元年,BERT、GPT-4、ChatGLM 等模型的非凡能力则展现出类似通用人工智能 (AI) 的巨大潜力,也因此得到了多行业、多领域的广泛关注。
2024-08-20 16:17:30 666
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人