自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(307)
  • 资源 (3)
  • 收藏
  • 关注

原创 扎克伯格说,Llama3-8B还是太大了,量化、剪枝、蒸馏准备上!

扎克伯格说,Llama3-8B还是太大了,不适合放到手机中,有什么办法?

2024-10-02 07:30:00 1018

原创 Llama3-8B到底能不能打?实测对比

前几天Meta开源发布了新的Llama大语言模型:Llama-3系列,本次一共发布了两个版本:Llama-3-8B和Llama-3-70B,根据Meta发布的测评报告,Llama-3-8B的性能吊打之前的Llama-2-70B,也就是说80亿参数的模型干掉了700亿参数的模型,这个还真挺让人震惊的。

2024-10-01 08:15:00 504

原创 2024中国政务行业大模型发展洞察报告|附29页PDF文件

大模型的发展推动人工智能产业加速升级,技术进步、需求升级、政策鼓励成为驱动政务行业大模型从理论走向实践的关键要素。

2024-09-30 10:25:15 662

原创 十分钟学会微调大语言模型

在之前的文章中,我分享了一些使用大语言模型开发应用的方法,也介绍了几个开源大语言模型的部署方式。

2024-09-28 15:31:44 759

原创 本地快速安装运行史上最强开源LLaMa3大模型

史上最强开源AI大模型——Meta的LLaMa3一经发布,各项指标全面逼近GPT-4。它提供了8B和70B两个版本,8B版本最低仅需4G显存即可运行,可以说是迄今为止能在本地运行的最强LLM。

2024-09-27 21:37:25 813

原创 【新书】AI驱动的开发者:使用ChatGPT和Copilot构建出色的软件

像ChatGPT和GitHub Copilot这样的AI编程工具正在改变我们编写代码和构建软件的方式。《AI驱动的开发者》揭示了使用AI实现可靠结果的实用最佳实践。它打破了炒作的迷雾,展示了这些工具如何通过现实世界的例子简化和增强日常任务,并激发你的创造力。

2024-09-26 17:24:09 868

原创 实战精选 | 5分钟利用 OpenVINO™ 部署 Qwen2.5

本文将以 Qwen2.5-7B-Instruct 为例,介绍如何利用 OpenVINO™ 的 Python API 在本地部署 Qwen2.5 系列模型。

2024-09-25 16:21:35 650

原创 2024年中国金融大模型产业发展洞察报告

随着生成算法、预训练模型、多模态数据分析等AI技术的聚集融合,AIGC**技术的实践效用迎来了行业级大爆发。在内部模型迭代与多技术协同的作用下,以“大规模”+“预训练”为核心的大模型产品,逐步由Transformer基础架构走向集图像识别、语义理解、视觉感知于一体的多模态、全应用模型体系,以产品化、业务化模式实现AIGC能力的进一步释放。

2024-09-23 21:08:01 938

原创 大模型最新书《大语言模型:导论》531页pdf!

大模型最新的书来了,这本《大语言模型:导论》它有531页pdf,是最新的书,目前这本书还没搞到手,但是后面肯定给大家拿到~

2024-09-23 20:59:16 742

原创 【美团招聘帖】大模型应用算法工程师,本岗位为社招岗位

【美团招聘帖】大模型应用算法工程师,本岗位为社招岗位

2024-09-20 20:48:51 1041

原创 AI智能体研发之路-工程篇(五):大模型推理服务框架LocalAI一键部署

今天开始写大语言模型推理服务框架的第三篇——LocalAI,这个框架相比于前两篇,如果服务器没办法科学上网,学习和使用难度都要上一个台阶,花了几个小时踩了几个坑,将排坑后的内容分享给大家,如果大家觉得有用的话,希望获得您的关注、收藏、点赞及评论。

2024-09-19 10:15:00 956

原创 【校招&社招】--京东科技大模型应用!校招+社招大模型岗!

【校招&社招】--京东科技大模型应用!校招+社招大模型岗!

2024-09-18 20:10:34 549

原创 AI智能体研发之路-工程篇(四):大模型推理服务框架Xinference一键部署

大语言模型推理服务框架—Ollama介绍了Ollama,Ollama以出色的设计一行命令完成推理框架部署,一行命令完成大模型部署,模型的下载不依赖梯子,速度非常快,大幅提升模型部署效率,同时,当有多卡GPU时,Ollama可以自动将模型分片到各个GPU上,博主使用V100显卡(单卡32G显存)部署llama3 70B(预计需要40G显存),自动完成了显存分配。

2024-09-18 11:15:00 736

原创 AI智能体研发之路-工程篇(三):大模型推理服务框架Ollama一键部署

身处2024年,大模型技术从底层模型到AI应用都卷的要命,我们可以说是幸运的,也可以是幸福的,当然,学习的路上,不停的追赶,必定是疲惫的。分享一些丝滑的大模型技术栈内的项目,让大家疲惫并快乐着。

2024-09-17 10:15:00 749

原创 AI智能体研发之路-工程篇(二):Dify智能体开发平台一键部署

Dify内置了包含搜索引擎、天气预报、维基百科、SD等工具,同时自定义工具的配置化接入,团队成员一人接入,全组复用,高效!临下班了,本来只是想参加个话题活动,洋洋洒洒几千字。可能加入了太多感慨吧。本文首先结合自己的工作写了一些对Agent AI智能体的见解,接着介绍了Dify框架快捷部署的过程,最后阐述了Dify框架的特点。个人认为Dify的发展会让Agent AI智能体开发提效,涌现更多有趣有价值的AI应用。

2024-09-16 09:45:00 1084 1

原创 AI智能体研发之路-工程篇(一):Docker助力AI智能体开发提效

由于近两年云原生热,大家对docker、docker compose及k8s或多或少都有一些涉猎,即便没有实际应用肯定也耳熟能详,今天对docker及docker compose的命令集进行梳理,大家可以收藏以便之后快速查阅。

2024-09-15 07:30:00 870

原创 LangChain: 大语言模型的新篇章

本文介绍了LangChain框架,它能够将大型语言模型与其他计算或知识来源相结合,从而实现功能更加强大的应用。接着,对LangChain的关键概念进行了详细说明,并基于该框架进行了一些案例尝试,旨在帮助读者更轻松地理解LangChain的工作原理。

2024-09-14 10:08:42 1272

原创 大模型书籍丨这本书太好了!150页就能让你上手大模型应用开发 (附PDF)

这是一本有关大模型应用开发的极简入门手册,为初学者提供了一份清晰、全面的“最小可用知识”,带领大家快速了解 GPT-4 和 ChatGPT 的工作原理及优势,并在此基础上使用流行的 Python 编程语言构建大模型应用。

2024-09-12 15:27:07 839

原创 大模型书籍丨GitHub 开源大模型零基础入门教程:从头构建大语言模型 (附书籍)

知名人工智能研究员、畅销书《Python 机器学习》的作者 Sebastian Raschka 最近又写了一本新书 Build a Large Language Model from Scratch !

2024-09-12 15:18:20 702

原创 【大模型微调】LLaMA Factory微调Llama3模型

LLaMA Factory是一款开源低代码大模型微调框架,集成了业界最广泛使用的微调技术,支持通过Web UI界面零代码微调大模型,目前已经成为开源社区内最受欢迎的微调框架。

2024-09-09 14:46:16 815

原创 大模型书籍推荐 | 中国人民大学最新书籍《大语言模型》(附文档)

大语言模型LLM综述文章《A Survey of Large Language Models》已经更新到第13个版本。该综述系统梳理LLM的研究进展与核心技术,讨论了大量的相关工作。

2024-09-08 09:15:00 712

原创 大模型畅销书推荐!大模型应用开发-动手做AI Agent!踏上AI Agent开发之旅,掌握尖端技术和实用技巧

本次书单我为大家收集了大模型相关的新书。探索 《大模型应用开发 动手做AI Agent》 是畅销作者黄佳老师的新书,带领读者踏上AI Agent开发之旅,掌握尖端技术和实用技巧。

2024-09-07 08:30:00 526

原创 大模型时代,孩子还有必要学编程吗?

随着大模型技术的迅猛发展,AI逐渐渗透到我们生活的方方面面。“AI”“GPT”“大模型”等新兴的关键词也频繁出现在教育领域,占据了家长们的视线,也牵动着爸妈的“焦虑”神经。

2024-09-06 14:55:26 726

原创 程序员入门大模型,2024年值得关注的畅销书单!

在知乎上, "如何系统的入门大模型? "这一话题引爆了超过50万读者的热烈讨论。作为程序员,我们应当是最先了解大模型的人,也是率先成为了解大模型应用开发的人,到底如何入门大模型的应用开发?

2024-09-06 14:53:26 303

原创 探索 LLaMA3:Meta 最新的语言模型和应用前景

在近年来的人工智能领域中,大型语言模型(Large Language Model, LLM)逐渐成为热门话题。这些模型以其强大的语言理解和生成能力,在自然语言处理(NLP)领域中展现了巨大的潜力和应用价值

2024-09-05 21:14:08 1005

原创 从 BERT 到 GPT:Transformer 模型在 AI 发展中的作用

Transformer 模型是自然语言处理(NLP)领域中的一种重要架构,由 Vaswani 等人在 2017 年提出,具有极大的影响力。

2024-09-05 21:11:58 905

原创 使用ollama + AnythingLLM快速且简单的在本地部署llama3

使用ollama + AnythingLLM快速且简单的在本地部署llama3

2024-09-04 15:30:04 924

原创 AI大模型实战篇:AI Agent设计模式,ReAct

随着人工智能技术的不断进步,AI Agent设计模式逐渐成为研究和应用的热点。ReAct模式作为AI Agent设计模式的起点,以其模拟人类思考和行动过程的特点,为各种智能应用提供了一种有效的实现途径。

2024-09-04 15:10:55 1185

原创 深度解析大模型领域:当下流行的人工智能大模型生成逻辑

在过去的几年里,人工智能领域经历了前所未有的革新,其中最引人注目的就是大规模预训练模型的崛起。这些模型,如GPT系列、BERT、T5、DALL·E和CLIP等,凭借其强大的语言理解和生成能力,已经在自然语言处理(NLP)、计算机视觉(CV)以及多模态理解等多个领域取得了显著成就。本文旨在深入探讨这些大模型的生成逻辑,揭示其背后的算法原理和技术挑战。

2024-09-02 16:00:22 1292

原创 大模型报告分享丨中国信通院重磅推荐《具身智能大模型发展报告(2024年)》发布,54页pdf

中国信息通信研究院、北京人形机器人创新中心有限公司联合发布了《具身智能发展报告(2024年)》报告。

2024-09-02 15:55:44 864

原创 开源大模型凉了?连Llama3都坐冷板凳,市场正在抛弃开源模型?

开源大模型凉了?连Llama3都坐冷板凳,市场正在抛弃开源模型?

2024-08-28 15:40:26 1106

原创 芜湖起飞!6个LLM大模型必学的核心技术!

Transformer 是大模型的底层模型。在深度学习的早期阶段,循环神经网络(RNN)是处理序列数据的常用方法。尽管RNN及其变体在某些任务上表现良好,但它们在处理长序列时容易遇到梯度消失和模型退化问题。

2024-08-28 15:24:28 1123

原创 LLM大模型篇:大模型发展迈入爆发期,开启AI新纪元

大模型发展呈现“规模定律”,Transformer为技术基座。大模型(LLM)发展普遍呈现“规模定律”特征,即:模型的性能与模型的规模、数据集大小和训练用的计算量之间存在幂律关系。

2024-08-26 15:56:19 972

原创 【LLM大模型】《自动驾驶中的多智能体强化学习》综述

强化学习(RL)是一种强大的序列决策工具,在许多具有挑战性的现实任务中取得了超越人类能力的表现。

2024-08-26 15:23:13 1284

原创 LLaMA3:开源战胜闭源意味着什么?

LLaMA3-405B的模型效果已经赶上目前最好的闭源模型GPT-4o和Claude-3.5,这可能是未来大模型开源与闭源的拐点,这里就LLaMA3的模型结构、训练过程与未来影响等方面说说我的看法。

2024-08-22 20:46:06 929

原创 【AI大模型】使用 SiliconCloud,免费使用最强开源大模型 Llama3.1-405b

当国内还有人说开源是智商税的时候,Meta 什么都没说,只是发布了开源标杆 Llama3.1。三种不同参数规模,8b,70b,405b。

2024-08-22 20:42:54 806

原创 【LLM大模型】ChatGLM-6B使用、微调、训练

【LLM大模型】ChatGLM-6B使用、微调、训练

2024-08-20 16:44:58 1092

原创 【LLM大模型】ChatGLM的医药行业舆情精选策略——大模型微调指南

【LLM大模型】ChatGLM的医药行业舆情精选策略——大模型微调指南

2024-08-20 16:37:27 1034

原创 【LLM大模型】Llama3.1 部署本地知识库应用

支持市面上主流的开源 LLM、 Embedding 模型与向量数据库,可实现全部使用开源模型离线私有部署。与此同时,该项目也支持 OpenAI GPT API 的调用。

2024-08-18 09:45:00 763

原创 【LLM大模型】首个超越GPT-4o的开源模型:LLAMA3.1开源了

今年4月份的时候,META发布了自己的第三代开源模型LLAMA3,并且在那次就说了LLAMA3目前还在训练当中。

2024-08-17 08:45:00 1032

Java版 愤怒的小鸟开源游戏

Java版 愤怒的小鸟开源游戏

2021-04-21

JAVA(鸡你太美)飞机游戏

JAVA(鸡你太美)飞机游戏

2021-04-21

捕鱼达人小游戏源码分享

一个已开源的java捕鱼达人游戏........

2021-04-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除