自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(677)
  • 收藏
  • 关注

原创 磨剑十余年!三位顶尖教授编写CV神书-pdf中文版分享!!!

书中内容直观体现了国内外教材的差异,经历了十年课堂经验的磨练。从视觉的起源、图像的形成开始,逐步深入讲解机器学习基础、图像处理、特征提取、图像表示等计算机视觉的重要组成部分,涵盖了卷积神经网络、循环神经网络等经典网络,以及Transformer、扩散模型等前沿技术。这本书可以说是计算机视觉领域的百科全书,为读者提供了全面深入的学习体验。这本书被认为是目前最权威、最前沿的著作,全面介绍了计算机视觉的基础知识并融合了最新的研究进展。一经发布,这本书引起了广泛关注并获得一致好评,许多人迫不及待想要阅读这部力作。

2024-09-14 14:49:39 66

原创 LLM推理提速40倍,真的很难吗?

大型语言模型(LLM)以其强大的生成、理解、推理等能力而持续受到高度关注。然而,训练和部署 LLM 非常昂贵,需要大量的计算资源和内存,因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的方法。这种推理方法很优雅,是 LLM 工作机制的核心。自回归 LLM 在只有数千个参数的情况下运行得很好,但对于实际模型来说就太慢了。为什么会这样,我们怎样才能让它更快?本文整理了这个问题的解决方案,从更好的硬件利用率到巧妙的解码技巧。01。

2024-09-14 14:31:41 820

原创 大模型算法工程师经典面试题————为什么现在的主流大模型都是 decoder-only 架构?

本人是某双一流大学硕士生,也最近刚好准备参加 2024年秋招,在找大模型算法岗实习中,遇到了很多有意思的面试,所以将这些面试题记录下来,并分享给那些和我一样在为一份满意的offer努力着的小伙伴们!!!

2024-09-14 14:20:06 845

原创 下载量10w+!LLM经典《大型语言模型:语言理解和生成》pdf免费分享

本书旨在为Python开发者提供实用工具和概念,帮助他们利用预训练的大型语言模型的能力,如拷贝写作、摘要等用例;深入了解基础Transformer模型的架构,如BERT和GPT等;以及优化LLMs的训练和应用方法。通过本书,读者将学习到如何利用各种方法优化LLMs,从生成模型微调到对比微调和上下文学习,为特定应用定制最佳的语言模型。近年来,人工智能在新语言能力方面取得了显著进展,深度学习技术的快速发展推动了语言AI系统在文本编写和理解方面的表现。这一趋势催生了许多新功能、产品和整个行业的兴起。

2024-09-13 17:21:00 330

原创 AI 时代,产品经理该如何进化

还是那句话,必须更加细分,产品经理才能在 AI 时代生存。当 AI 和大模型带来的自然语言交互 LUI 成为主流,产品经理还有存在的价值吗?这大概是当下所有产品经理,心中最大的疑问和恐惧。是不是 Prompt 做得好,就能做产品经理了?到底该怎么驯服 AI 这个「黑箱」,得到自己想要的结果?面对这些问题,来自完美世界技术中心产品总监罗一聪,根据自己的经验,总结了在 AI 时代中,产品经理可能需要的品质和特性。传统的互联网业务或者游戏业务,产品或者业务输出需求,技术人员只需要指哪打哪就好了。

2024-09-12 11:57:09 953

原创 万字长文:AI产品经理需要了解的算法知识

简而言之,NLP是让计算机理解自然语言,而NLG是让计算机生成自然语言。两者结合在一起,可以构建出更加智能和交互式的应用程序,如智能助手、自动写作系统和交互式对话系统。

2024-09-12 11:43:41 1531

原创 AI产品经理必须知道的技术 之 【RAG】

在对用户问题进行Embedding前,对问题进行补充完善。避免用户问题太过简单、或者有明显错误。也可以考虑将用户问题,进行主题关键词抽取,或者使用知识图谱等进行初步的信息识别。这么做的目的是,避免用户的问题,信息太多太杂,导致检索出来的相关文档,与用户提问意图关联不大。也就是对用户问题进行简化。在检索文档时,可以增加一些过滤条件,例如指定章节、关键词包含、日期筛选、相似度阈值等,以使检索出来的内容更准确。对检索结果,也可考虑将相似度,与文档自身的权重进行综合加权。使提供给大模型的内容资料是最优的。

2024-09-10 15:25:18 771

原创 AI产品经理必备技能:如何从需求挖掘到智能化产品落地

AI产品经理的角色不仅仅是产品的需求推动者,更是智能化变革的引领者。通过从需求处理、市场调研、产品设计到数据驱动的全流程工作,AI产品经理可以为用户提供更加智能、高效的服务,推动电信行业的持续创新。

2024-09-10 14:39:05 811

原创 AI 产品经理如何理解强化学习?

AI领域很多技术原理,都可以从人脑在现实世界中学习找到参照对应。随着社会智能化水平提升,智能体概念应用场景越来越广,提到智能体绕不过去的是强化学习技术,本篇探讨下AI产品经理对强化学习的理解。

2024-09-10 11:49:44 699

原创 「大数据思维」究竟怎么用?7个案例:AI时代产品经理必备的真相!(9.3k字,附资料)

近十年来,大数据旋风以“迅雷不及掩耳之势”席卷全国。大数据已然成为继云计算、物联网之后新一轮的技术变革热潮!在实际工作中,无论是产品规划、BI决策,还是当前大模型、智能算法时代,都在使用数据(或大数据),并形成了体系化的解题方法论。本文用故事的方式,分享在数据应用上避开的坑或抓住的重点。

2024-09-10 11:43:03 1091

原创 Meta开源全球最大模型Llama3,手把手纯小白本地安装,可视化使用,不需要会编程,小学生可学会,国内可下载

比如,先进入models文件夹,再新建一个文件夹model,进入model,再新建一个文件夹a,进入a,把模型放到a文件夹里。总结一下,默认的模型存放路径(Local models folder)是C:\Users\xxx\.cache\lm-studio\models而模型在。方式二:模型在这个软件中短暂的有几个小时可以下载,可能还需要魔法,但魔法也没用了,因为现在已经没有了。下图1、2、3步选择模型,4步输入全局配置让它用中文回答(没有这一步的话,它的回答都是英文),第5步就开始聊天了。

2024-09-08 17:30:00 419

原创 HuggingFace + Ollama + Llama 3.1:轻松搞定Llama 3.1中文微调版本安装

通过 Ollama 在个人电脑上快速安装运行 shenzhi-wang 的 Llama3.1-8B-Chinese-Chat 模型,不仅简化了安装过程,还能快速体验到这一强大的开源中文大语言模型的卓越性能。希望本文能为在个人电脑使用大模型提供一些启发。如果您在安装或使用过程中遇到任何问题,欢迎在评论区留言。

2024-09-07 13:45:00 830

原创 书籍下载-《基于Pytorch手撸深度学习:初学者指南》

在本书中,作者以结构化、渐进和从第一原理的方法来学习PyTorch(并在适当的时候解决漂亮的图像分类问题)。本书的任务是让您理解这个主题,因此作者将尽量避免使用花哨的数学符号,并用简单的英语来表达。序列(RNN,GRU,LSTM,seq2seq模型,注意力机制,自注意力机制,transformers)作者会问你问题(然后很快给出答案),还会开些(愚蠢的)玩笑。自然语言处理(标记化,嵌入,上下文词嵌入,ELMo,BERT,GPT-2)计算机视觉(更深层次的模型和激活函数,卷积,迁移学习,初始化方案)

2024-09-06 14:54:18 339

原创 PyTorch实战宝典2.0震撼登陆!五年匠心巨献,重启你的深度学习巅峰之旅!

书中中篇的实战章节,是无数读者翘首以盼的精华所在。你将深入NLP的腹地,从RNN的经典到GPT的惊艳,再到LLM的前沿探索,五大应用任务让你感受到自然语言处理的强大魅力。还是经验丰富的老将,希望在技术的浪潮中再攀高峰,《PyTorch实用教程》(第二版)都将是你不可多得的伙伴。从基础入门到高级应用,从理论讲解到实战演练,这本书为你铺设了一条清晰的学习路径,让你的深度学习之旅不再迷茫。理论与实践并重:既有深入浅出的理论讲解,又有丰富多样的实战案例,让你在学中做,在做中学,实现知识与技能的双重飞跃。

2024-09-06 14:46:08 337

原创 RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库

本文主要是 Milvus 向量数据实战总结。LLM 痛点以及解决方案RAG 是什么,为什么选用RAG。langchain文档加载器,chat model文档拆分的注意点,chat model区别。chat 示例代码。

2024-09-04 11:57:11 1296

原创 使用Dify搭建企业知识库聊天机器人

如果你的知识库文档比较复杂,或者每一段的内容都很多,就需要你手动操作了。我准备了一份文档给大家练练手### 如何创建新项目?要创建一个新项目,您需要首先登录到您的项目管理平台并进入主界面。在右上角,通常会有一个“新建项目”或“创建项目”的按钮。点击这个按钮后,系统会引导您进入一个新的页面或弹出一个窗口,要求您填写项目的基本信息。1. **项目名称**:首先,您需要为项目命名。项目名称应该简洁明了,同时具备描述性,以便您和团队成员能够轻松识别项目的目的或内容。

2024-09-04 11:46:04 843

原创 搭建本地大模型和知识库最简单的方法

经过了一年多时间的迭代,大模型种类繁多,使用也越来越简单了。在本地跑大模型,个人认为目前最好的软件肯定是Ollama无疑了

2024-09-04 11:34:04 604

原创 2024最新丨分享10篇优秀论文,涉及大模型微调、Transformer、混合模型等热门话题

今天分享10篇最近刚刚公布的论文,涉及大模型微调、Transformer替换、LoRA、实体关系抽取、大模型幻觉等热门研究方向。其中关于将多个模型协同混合可媲美ChatGPT,论文特别有意思。

2024-08-31 23:26:18 1021

原创 分享10篇最新论文:涉及大模型Prompt调优、LLM安全、推理增强、图学习等热门方向!

Google等发表的最新的一篇研究文章指出,ChatGPT、 PaLM-2 等黑盒语言模型信息是非常容易窃取的,具体来说,在给定典型的 API 访问的情况下,作者攻击恢复了Transformer模型的嵌入投影层(直到对称性),且攻击花费不到 20 美元,提取了 OpenAI 的 Ada 和 Babbage 语言模型的整个投影矩阵。为此,蚂蚁的研究人员开发了COULER系统,它可以通过自然语言描述生成ML工作流程,并为不同的工作流程引擎提供统一的编程接口,简化了用户的操作。

2024-08-31 22:43:38 952

原创 现在市场上有哪些大模型?什么样的大模型适合国内企业?

这个回答基本上涵盖了大多数的大模型,首先这是国外的的大模型。自从openAI开源以后,大模型现在多不胜数,国内也龙飞凤舞在国外,自从去年,open AI发布了以chat Gpt为代表的模型,今年有发布了文生视频大模型Sora。此外,公司还拥有自然语言转图片的应用DELL E2。国外科技巨头如英伟达、谷歌、微软、亚马逊、苹果、Meta、Adobe等大厂都演化了了生成式AI大招。

2024-08-30 17:22:13 813

原创 垂直领域大模型微调的实战经验大揭秘

这段时间,一直在思考微调垂直大模型。涉及的领域:大数据和大模型。由于配置和经费问题,想着用一个小模型去微信一个大数据专家。基于Qwen2-0.5B模型进行垂直微调,利用【数据中台-让数据用起来(第2版)】PDF书籍制造问答数据。初期效果不是很好,特别是模型合成的时候,更不好了。。在查阅知乎的时候,看到一篇微调模型总结,分享给小伙伴…垂直领域大模型微调的实战经验,从基座模型选择、模型整体架构、数据设计和训练微调四个方面进行详细解析。

2024-08-30 16:35:25 352

原创 2024大模型典型示范应用案例集(附下载)

案例集精选99个优秀案例,包括45个行业赋能、46个智能应用和8个生态服务案例,集中展示了大模型技术如何助力企业提升效率、优化服务和创新产品。特别值得一提的是,上海成为大模型应用的热土,超过半数的案例集中于此,彰显了上海在大模型技术应用方面的领先地位。大模型技术的应用不仅推动了产业升级,也促进了新质生产力的培育。通过智能数据标注、评测系统和云边融合服务等创新平台,大模型技术正不断拓展其在各行业的应用边界。AI智能体的引入,更是成为大模型应用的新热点,预示着人工智能技术在未来生产和服务中的核心地位。

2024-08-29 14:54:49 876

原创 人人都能玩得起AI机器人!HuggingFace开源低成本解决方案

近日,HuggingFace开源了低成本AI机器人LeRobot,并指导大家从头开始构建AI控制的机器人,包括组装、配置到训练控制机器人的神经网络。当前的AI机器人,已经可以上蹿下跳后空翻、再接闪电五连鞭,代替人类承担各种工作。哪怕是当大号手办,咱也想整一个玩玩。但无奈目前大多公司还在研发阶段,少数能量产的又有亿点小贵。当然了,小编相信AI和机器人最终会走进千家万户。而现在,我们可以玩到一个低成本的解决方案——LeRobot:——不知诸位可还记得「炒菜大师」ALOHA?

2024-08-29 14:40:59 979

原创 GLM-4-Flash免费:在线微调GLM-4-Flash + Function Calling搭建法律知识库

随着法律行业的数字化转型加速,构建一个智能化、高效能的法律知识库成为了提升法律工作效率、辅助法律决策的重要一环。一、,方便大家向更广泛、更深入的应用场景迈进。数据加密:确保在数据传输和存储过程中采用加密技术,保护用户数据和法律案件信息的机密性。访问控制:实施严格的访问控制策略,限制对模型服务和案件数据库的访问权限,防止未经授权的访问和数据泄露。合规性审查:定期对模型服务和案件数据库进行合规性审查,确保符合相关法律法规的要求。

2024-08-29 10:44:12 890

原创 0成本5分钟!利用开源大模型搭建本地专属AI知识库

你一定经历过各种通用大模型一本正经胡说八道的时候吧,AI一通丝滑输出让人真假难辨,防不胜防。这种情况被称为。大模型产生幻觉不幸“翻车”的原因很大程度上是“先天不足”,例如训练时来自特定领域的训练数据就比较缺失或存在偏差等。对于企业,AI的幻觉已经成为阻碍其落地应用的严重缺陷。我们自然想让一些企业内部私有数据也进入到大模型推理分析的过程,让其更好服务于日常业务,但出于信息安全等考量,私有数据显然不可随意上传到第三方平台。针对这种情况,将企业内部知识库和大模型连接起来构建一个不失为一种简易的解决方案。

2024-08-28 15:22:10 879

原创 创业必看!AI Agent 开源和创业项目全盘点

当前 AI Agent 和其基础设施的发展还处于非常早期的阶段,我们能看到的是一系列尚未商业化或整合到更广泛服务中的运营服务和开源工具。在这个领域,谁会成为最后的赢家还远未明确——这些最终的赢家可能今天还非常年轻,甚至还未出现。

2024-08-28 11:59:10 839

原创 《HuggingFace自然语言处理详解——基于BERT中文模型的任务实战》

本书综合性讲解HuggingFace社区提供的工具集datasets和transformers,书中包括最基础的工具集的用例演示,具体的项目实战,以及预训练模型的底层设计思路和实现原理的介绍。通过本书的学习,读者可以快速掌握HuggingFace工具集的使用方法,掌握自然语言处理项目的一般研发流程,并能研发自己的自然语言处理项目。★内容全面 本书是一本对HuggingFace工具集进行综合性讲解的图书,既有基础知识,也有实战示例,还包括底层原理的讲解。

2024-08-28 11:49:32 321

原创 Transformer、BERT和GPT:包括ChatGPT和提示工程,379页pdf

关键章节提供了深度学习中注意力演化和重要性的洞见、Transformer架构的复杂性、对BERT家族的两部分探索,以及关于使用GPT-3的实践指导。结尾章节概述了ChatGPT、GPT-4和使用生成性AI的可视化。目录 1: 注意力机制 2: 令牌化 3: Transformer架构介绍 4: 更深入的Transformer架构 5: BERT家族介绍 6: 更深入的BERT家族 7: 使用GPT-3介绍 8: 更深入的使用GPT-3 9: ChatGPT和GPT-4 10: 使用生成性AI的可视化。

2024-08-27 16:33:37 217

原创 真就绝了!世界上唯一一本全面解析Transformer的神书!

这是目前世界上唯一一本全面解析Transformers的宝藏书籍,在亚马逊的售价高达140美元,涵盖60多个Transformer架构和对应的知识及技巧,完全可以满足大家在语音、文本、时间序列和计算机视觉等方向的需求,并且只需要本科基础就完全能够看懂。

2024-08-27 16:20:17 105

原创 探索大模型应用:构建基于检索的RAG实战指南

在AI技术的浪潮中,大模型以其强大的问题回答能力,正逐渐渗透到各行各业,成为推动行业发展的新引擎。然而,大模型并非万能,它在实时性和私有领域知识覆盖上存在局限。为了克服这些限制,本文将带你深入了解如何利用检索增强生成模型(RAG)来扩展大模型的能力,并通过一个实战案例,展示如何构建一个基于RAG的AI知识库。

2024-08-25 07:30:00 796

原创 2024生成式人工智能(GenAI)在生物医药大健康行业应用进展报告

该报告结合行业实践和实际需求,从ChatGPT技术原理、技术发展、医疗健康行业国内外应用和研究进展,以及ChatGPT大模型在医药场景测试等角度,提出了ChatGPT大模型在医疗健康行业落地的挑战及可能的路径,为在ChatGPT背景下大模型如何赋能医疗健康行业数字化转型提供参考。通过研讨会、咨询、概念验证(POC)、项目申报等形式,我们交流并见证了GenAI在国内生物医药大健康行业的快速发展和面临的挑战,积累了来自第一线的资料和GenAI应用落地的经验和方法论。

2024-08-24 11:26:09 425

原创 AI大模型·白皮书 | AIGC实践案例集锦2024(235页)

AIGC技术在内容创作、数字电商、企业生产以及医疗、教育等多个领域展现出巨大潜力,为各行各业带来前所未有的创造力与想象力。该报告基于InfoQ AIGC频道内容,精选提炼,涵盖大咖视野、观点碰撞、应用案例、技术实践与AI测评室五部分。展示了互联网产品、企业生产提效、医疗、教育等行业的大模型应用案例,以及热门大模型的实测评价,为读者提供全面而深入的行业视角。

2024-08-24 11:10:50 195

原创 大语言模型白皮书,让你彻底搞懂训练,微调和提示工程

当下,像大语言模型这样的生成式AI很火,相应的学习资源也如雨后春笋,我从中挑选一份好的学习资料分享给大家。一共有两个pdf文档,一个教如何从零开始训练一个大模型,另一个教如何微调大模型,每个文档仅有23页,如果想涵盖全部内容就难免会缺少一些细节,对于想入门LLM的可以用它先来形成一个整体的思维脑图,然后再去补充细节。下面是对LLM Training内容的总结:模型搭建选择模型扩展定律讨论了模型大小和数据量之间的关系,总的来说,扩大模型,训练数据量也应按比例增加。硬件考量。

2024-08-23 18:16:33 515

原创 白皮书 |《华为预训练大模型白皮书》|| (附 62页PDF 限时免费下载)

对大模型的需求,本质上是对大数据的需求:当前的人工智能算法,尚无法高效地建模不同数据之间的关系, 并以此解决模型泛化的问题;从这一角度看,大模型对数据的应用,依然处于比较初级而低效的水平。可以预见到,这种方式的边际效应是明显的:数据集越大、模型越大,提升同等精度所需要的代价就越大。要想通过预训练大模型真正解决人工智能问题,看来也是不太现实的。华为云团队撰写的《预训练大模型白皮书》,将其在大模型研发和落地中的经验总结出来,分享给学术界和工业界,对推动预训练大模型理论、方法、技术、应用的发展具有重要意义。

2024-08-23 18:04:10 166

原创 清华重磅首发:中国首份汽车行业大模型白皮书!AI Agent行业落地

清华大学自然语言处理实验室、易慧智能、面壁智能三方共同发布了这本《大模型驱动的汽车行业群体智能技术白皮书》。这是国内首个关于大语言模型驱动的群体智能全面的研究报告和行业应用探索。该白皮书深度剖析了我国汽车行业的市场现状、消费需求变迁、供给侧挑战,并结合大语言模型及群体智能技术的发展趋势,为汽车行业智能化发展提供了关键的理论支撑与实践引导。大模型技术的兴起,对于汽车企业的智能化转型是一次全新的机遇。汽车行业具备数据丰富、场景明确、技术成熟、市场需求高和行业竞争激烈等特点,恰好是最适合 AI Agent 落地

2024-08-23 17:49:02 260

原创 怎样用生成式 AI 给自己找下一份工作

生成式 AI 可以帮你写出能在招聘方人资系统中脱颖而出的简历,还能识别出那些浪费时间的“虚假工作”。如今的求职者不仅需要打磨自己的技能、经验和工作经历,还得精通搜索引擎优化技巧,让自己在求职者跟踪系统(ATS)中脱颖而出。哪怕你只是要找一份真实存在的工作,也得这么做。“我甚至不知道他们发布的职位是否真的存在,”Ritika Singh 对 The New Stack 这样抱怨。这位 5 月份被解雇的敏捷教练正被大量虚假职位所困扰——这些岗位甚至都没在招人。

2024-08-22 15:08:01 755

原创 在顺丰,AI 和大模型如何应用到物流场景?

在客服对话和邮件中广泛使用,每天生成超过 2 万多条客服摘要,直接可用率 88%,对客服工作提效显著。第三部分是。

2024-08-22 14:50:21 678

原创 大模型应用开发时代,竟有人预言“人人都可以成为程序员”?

随着人工智能技术的飞速发展,大语言模型(如 ChatGPT)已成为开发者们关注的焦点。人工智能也正在加速与各行各业融合,催生出大量创新应用,在教育、金融、医疗、法律、设计等诸多领域大显身手。就说说我平常用得比较多的 LangChain 网站,大语言模型早就渗透到了网站功能设计中,比如下面两张图的绿箭头处,所显示的文档检索功能,都是基于大语言模型所开发的。为什么「大模型应用开发」如此重要?首先,大模型能够处理和理解非常复杂的数据模式,提供了可能;其次,它可以大大。

2024-08-22 14:49:04 614

原创 深度!千字长文拆解AI Agent ,浅谈国内AI Agent 现状

这种Agent既可以是软件形式的程序,例如对话机器人,也可以具备物理形态,比如扫地机器人。在了解AI Agent之前,我们先考虑一个场景:我们要写一本20万字的关于人工智能最新技术的书在没有大模型之前,我们一般会按照如下流程~第一步:先使用搜索引擎搜索一些相关书籍和信息进行阅读,为我们打开思路第二步:形成本书的大纲,并且考虑清楚每一章节要编写的内容第三步:针对每一个章节进行内容的编写,在编写过程中可能会调整文章的大纲第四步:在编写后面章节的时候可能会忘记前面写的内容,需要去翻阅前面已经写的内容。

2024-08-22 14:11:32 914

原创 大模型时代,新手和程序员如何转型入局AI行业?

在当今大模型迅猛发展的环境下,人工智能的应用越来越广泛。然而,这些大模型的背后隐藏着更为深厚的基础技术——传统机器学习和神经网络。理解这些基础技术,不仅能够帮助我更好地使用大模型,还能为我提供创新和解决实际问题的能力。因此,在这个AI迅猛发展的时代,掌握传统机器学习和神经网络显得尤为重要。在近期的全国两会上,“人工智能”再次被提及,并成为国家战略的焦点。这一举措预示着在接下来的十年到十五年里,人工智能将获得巨大的发展红利。

2024-08-21 15:36:47 818

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除