自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(913)
  • 收藏
  • 关注

原创 大模型应用开发:手把手教你部署并使用清华智谱GLM大模型

本文就来分享下我的安装部署经验,包括本地和租用云服务器的方式,以及如何通过API调用大模型开发自己的AI应用,希望能解决一些下不去手的问题。

2024-10-01 10:00:00 509

原创 大模型项目推荐丨《开源大模型食用指南》全网发布,轻松助你速通llm大模型!

《开源大模型食用指南》 是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。

2024-09-30 10:38:30 752

原创 如何在本地部署大模型服务?

本文将讲述如何在本地部署大模型服务,并使用Embeeding、向量数据库和LangChain构建本地知识库

2024-09-28 14:48:40 400

原创 LLaMA-Factory微调入门个人重制版

LLaMA-Factory微调入门个人重制版

2024-09-27 21:41:33 933

原创 大模型行业报告丨《量子计算发展态势研究报告(2024年)》

2024年9月25日,在2024中国国际信息通信展览会(PT展)上,中国信息通信研究院(简称“中国信通院”)、中移(苏州)软件技术有限公司和北京玻色量子科技有限公司联合发布《量子计算发展态势研究报告(2024年)》。中国信通院技术与标准研究所王敬对报告进行了解读。

2024-09-26 17:07:00 845

原创 生成式人工智能和大语言模型:自然语言处理与生成对抗网络

生成式人工智能(GAI)和大语言模型(LLM)是以无监督或半监督方式运行的机器学习算法。这些算法利用现有内容,如文本、照片、音频、视频和代码,生成新内容。其主要目标是生成真实且新颖的材料。

2024-09-26 17:04:58 962

原创 通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践

通义千问1.5在先前发布1.0版本模型的基础上进行了大幅更新,主要体现在如下三个方面:多语言能力提升:Qwen1.5在多语言处理能力上进行了显著优化,支持更广泛的语言类型和更复杂的语言场景。人类偏好对齐:通过采用直接策略优化(DPO)和近端策略优化(PPO)等技术,增强了模型与人类偏好的对齐度。长序列支持:所有规模的Qwen1.5模型均支持高达32768个tokens的上下文长度,大幅提升了处理长文本的能力。在性能评测方面,Qwen1.5在多项基准测试中均展现出优异的性能。

2024-09-25 16:16:54 657

原创 通义千问!Qwen2大模型微调入门实战(完整代码)

该教程介绍了如何使用Qwen2,一个由阿里云通义实验室研发的开源大语言模型,进行指令微调以实现文本分类。

2024-09-25 16:04:50 905

原创 2024最新大模型大厂面试八股(含100道问题+答案)

最近秋招正在如火如荼地进行中,看到很多人的简历上都包含大模型相关的工作,各家大厂和初创都很舍得给钱,动辄百万年包也变得不再稀奇。在大模型纵横的这个时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。

2024-09-23 20:27:55 790

原创 强烈建议收藏!从零开始学PyTorch ( 附上试读!)

这是一本开源的书籍,目标是帮助那些希望和使用 PyTorch 进行深度学习开发和研究的朋友快速入门,其中包含的。由于本人水平有限,在写此教程的时候参考了一些网上的资料,在这里对他们表示敬意,我会在每个引用中附上原文地址,方便大家参考。这是一本开源的书籍,目标是帮助那些希望和使用 PyTorch 进行深度学习开发和研究的朋友快速入门。深度学习的技术在飞速的发展,同时 PyTorch 也在不断更新,且本人会逐步完善相关内容。由于 PyTorch 版本更迭,教程的版本会与 PyTorch 版本,保持一致。

2024-09-23 20:12:23 692

原创 鹅厂!鹅厂!鹅厂!腾讯大模型实习生招聘了

鹅厂!鹅厂!鹅厂!腾讯大模型实习生招聘了

2024-09-20 20:28:22 725

原创 Cupshe北美市场沙滩装的领导品牌:大模型算法方向的招聘贴

Cupshe是北美市场沙滩装的领导品牌,是亚马逊目前最大的beachwear brand seller,也是Shopify全球全品类前15的品牌商店。

2024-09-20 20:26:05 1213

原创 【RAG】向量数据库拥抱大模型

向量数据库是一种专门用于存储和查询向量数据的数据库系统,它在处理大规模高维数据方面具有显著优势。

2024-09-18 17:47:40 1214

原创 使用Ollama本地部署Llama 3.1大模型

2024 年 7 月 24 日,Meta 宣布推出迄今为止最强大的开源模型——Llama 3.1 405B,Llama 3.1 405B 支持上下文长度为 128K Tokens, 增加了对八种语言的支持,号称第一个在常识、可操纵性、数学、工具使用和多语言翻译方面与顶级人工智能模型相媲美的模型。

2024-09-16 11:00:00 769

原创 Prompt提示词调优工具介绍-promptfoo

Prompt提示词调优工具介绍-promptfoo

2024-09-15 08:15:00 752

原创 LLM下半场之Agent基础能力概述:Profile、Memory、Plan、Action、Eval学习笔记

Agent的概念是创造一个个场景的智能体,可以在某些领域,比如在社会分析、电商导购、工业制造方面提供解决方案。LLM的发展将会让Agent的诞生成为可能,也会推动各个领域的Agent发展,所以我说Agent将会是LLM的下半场。

2024-09-14 09:38:49 1069

原创 Prompt提示词调优工具介绍-ChainForge

在人工智能和自然语言处理领域,大型语言模型(LLM)的兴起为各行各业带来了巨大变革。然而,如何有效地评估和优化这些模型的输出一直是一个挑战。为了解决这个问题,来自哈佛大学人机交互实验室的研究人员开发了ChainForge - 一个开源的可视化工具包,旨在简化提示词工程及评估测试的过程。

2024-09-14 09:19:43 733

原创 大模型书籍丨人大赵鑫教授出书《大语言模型》,第一本中文大语言模型教程!

今年4月中旬, 人大赵鑫教授出书了《大语言模型》一书, 作为第一本中文大语言模型教程, 立刻引起广泛关注, 该书内容偏综述性, 非常系统性地介绍了大语言模型的基本原理、核心技术和研究进展, 对于了解大语言模型的全貌会有非常好的帮助。

2024-09-12 14:39:14 797

原创 大模型书籍丨Dennis Rothman 大模型黑书无敌!强烈推荐

大模型黑书,Dennis Rothman的大作。 就是下图这本书,出版后受到很多赞誉,也是很多人都推荐的读物。

2024-09-12 14:33:44 279

原创 《开源大模型食用指南》,一杯奶茶速通大模型!新增Examples最佳实践!

Self-llm 开源项目是一个围绕开源大模型、针对国内初学者、适合中国宝宝的专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。

2024-09-09 14:14:40 848

原创 大语言模型应用指南:以GPT为起点,从入门到精通的AI实践教程

在20世纪末和21世纪初,人类经历了两次信息革命的浪潮。然而,随着技术的不断演进和人类社会的不断发展,我们正站在另一个信息时代的门槛上。这是一个更加智能化、更加联系紧密的时代,它将重新定义我们与世界互动的方式,塑造我们的生活、工作和社会关系。2022年11月30日,OpenAI发布了ChatGPT⸺一个基于生成式预训练Transformer (Generative Pre-trained Transformer,GPT)技术的语言模型。

2024-09-08 08:00:00 685

原创 分享轩辕大模型的实践与应用

在人工智能的浪潮中,大模型正以其独特的方式重塑金融科技的未来。在4月26日的2024年全球机器学习技术大会上,作为度小满数据智能部总经理和技术委员会执行主席,本人有幸代表团队分享了轩辕大模型在金融行业的实践与应用。

2024-09-07 06:45:00 1497

原创 【LLM大模型】如何系统的从0到1学习大模型?相关书籍及课程那些比较好?

大模型入门不可错过的一本书,就是这本大模型界的经典畅销书 《大规模语言模型》 !系统性强,内容适合初学者,如果你想知道如何构建一个大模型应用,系统了解大模型的构建,选它准没错!

2024-09-06 14:03:01 854

原创 LLM大模型好书分析:大模型黑书优缺点客观分析!

大模型黑书,Dennis Rothman的大作。 就是下图这本书,出版后受到很多赞誉,也是很多人都推荐的读物。

2024-09-06 13:58:01 611

原创 如何系统的从0到1学习大模型?这两本大模型书籍太香了

个人比较推荐的是两本关于大模型的书:《大模型应用解决方案》和《快速部署大模型》。这两本书关于上述知识都有完整的覆盖及详细的讲解,这两本书相辅相成,前者主要围绕一系列经典Transformer模型,以项目制的方式开展知识讲解;后者则补充了大语言模型(LLM)最新的前沿技术。

2024-09-06 13:49:08 412

原创 大模型入门:Mistral 大语言模型

Mistral AI 是一家销售人工智能产品的法国公司。它由 Meta Platforms 和 Google DeepMind 的前员工于 2023 年 4 月创立。该公司于 2023 年 10 月筹集了 3.85 亿欧元,2023 年 12 月估值超过 20 亿美元

2024-09-05 14:34:40 1079

原创 LLM大语言模型应用框架介绍

大语言模型的英文全称为:Large Language Model,缩写为 LLM,也被称为大型语言模型,主要指的是在大规模文本语料上训练、包含百亿级别参数的语言模型,它用来做自然语言相关任务的深度学习模型。

2024-09-05 14:28:51 771

原创 LLM大模型应用设计思考:大模型+bi,TFlowAI如何让大模型来检索数据

TFlowAI提出了一种基于大模型的解决方案,通过理解业务、查找数据、分析处理的过程编排,实现模型自主的基于数据库的数据查询与分析。这种方法不仅降低了开发成本,还提升了使用体验。

2024-09-04 14:54:11 795

原创 随着AI产品的逐渐出现是否应该焦虑

本文将从AI对就业市场的影响、隐私与安全挑战以及如何积极利用AI带来的机遇等角度出发,探讨如何在保证安全和伦理的前提下,最大化利用AI技术的优势。

2024-09-04 14:51:19 824

原创 大模型书籍推荐丨这本大模型权威教材必看!大模型私有化部署真不难(附PDF)

《ChatGLM3大模型本地化部署、应用开发与微调》作为《PyTorch 2.0深度学习从零开始学》的姊妹篇,专注于大模型的本地化部署、应用开发以及微调等。

2024-09-02 15:37:01 908

原创 大模型agent开发之提示词选择器

有时候单一的提示词模版无法满足复杂的任务需求,因此需要结合选择器使大模型有更加准确的判断,尤其是在高度上下文依赖性的对话或生成任务时,动态的选择最合适的示例或者提示词时尤其重要。

2024-09-02 15:35:30 994

原创 国产大模型王炸发布!API 正式免费用,第一手token白嫖分析

今日,智谱 BigModel 开放平台正式宣布:GLM-4-Flash 全部免费,同时开启限时免费微调活动。

2024-08-28 14:58:21 1027

原创 【ChatGLM】终于!智谱GLM-4-9B 支持 Ollama 部署

GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中, GLM-4-9B 在各项能力上均表现出卓越的能力。

2024-08-28 14:44:37 1204

原创 大模型如何生成可控文本?人大等最新《大型语言模型的可控文本生成》综述

在自然语言处理(NLP)领域,大型语言模型(LLMs)已展示出高质量的文本生成能力。然而,在实际应用中,LLMs必须满足日益复杂的需求。除了避免生成误导性或不恰当的内容外,LLMs还需要满足特定用户的需求,例如模仿特定的写作风格或生成具有诗意丰富性的文本。

2024-08-26 15:12:11 741

原创 8月最新大语言模型新书!赵宇教授《自然语言处理:大模型理论与实践》449页pdf!

在当今的人工智能时代,NLP技术已经深入渗透到我们日常生活的各个方面,从智能助手、语音识别到机器翻译和文本生成,NLP正在以令人瞩目的速度改变着我们的生活方式。

2024-08-26 15:08:11 414

原创 小白学大模型:GLM api调用教程

在这里,你会发现丰富的 代码示例👨‍、实用指南🗺️ 以及 资源链接🔗,或许能帮助你轻松掌握 GLM API 的使用!

2024-08-23 16:26:18 884

原创 小白学大模型:LLaMA-Factory 介绍与使用

LLaMA-Factory是一个统一的框架,集成了一套先进的高效训练方法。它允许用户通过内置的Web UI灵活定制100多个LLMs的微调,而无需编写代码。

2024-08-23 16:20:36 946

原创 LLaMA 3 背后的大规模 GPU 集群 RoCE 网络建设

模型越来越大,需要的 GPU 越来越多;与此同时 GPU 性能也在不断增强,配套的网络带宽也不断增加到 400G(Blackwell GPU 甚至需要到 800 Gbps)。

2024-08-22 20:27:22 883

原创 Llama 3.1对我国AIGC产业发展的启示

我国开源大模型的发展还存在一些差距和不足。因此,有必要深入研究Llama3.1的发布,探讨其对我国开源大模型发展的启示。

2024-08-22 20:22:19 694

原创 如何优化ChatGLM-6B?一行代码就行 | 最“in”大模型

ChatGPT 的横空出世开启了大语言模型 (LLM) 的普及元年,BERT、GPT-4、ChatGLM 等模型的非凡能力则展现出类似通用人工智能 (AI) 的巨大潜力,也因此得到了多行业、多领域的广泛关注。

2024-08-20 16:17:30 666

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除