自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(225)
  • 问答 (2)
  • 收藏
  • 关注

原创 暑假两个月学习AI产品经理详细路线,看这一篇就够了

以下是一个暑假期间学习AI产品经理的详细路线,分为八个周来进行:第1周:了解AI产品管理基础阅读材料:《人工智能:一种现代的方法》了解AI基础。《人人都是产品经理》了解产品管理基础。在线课程:Coursera上的“人工智能基础”课程。edX上的“产品管理基础”课程。实践:调研市场上现有的AI产品,分析其功能、用户群体和市场定位。第2周:深入学习AI技术在线课程:Udacity的“深度学习纳米学位”基础课程。

2024-07-19 09:57:24 1210

原创 AI大模型从零到专家:全面教程,一课掌握!

坚持到了这儿,恭喜你,表示你有做AI大模型工程师的潜力。其实我想说的上面的内容只是冰山一角,刚开始大家不需要多么精通了解这些内容。主要是不断练习,让自己跳出「舒适区」,进入「学习区」,但是又不进入「恐慌区」,不断给自己「喂招」。记住,学习是一个持续的过程。大模型技术日新月异,每天都有新的研究成果和技术突破。要保持对知识的渴望,不断学习最新的技术和算法。同时,实践是检验学习成果的最佳方式。通过实际项目实践,你将能够将理论知识转化为实际能力,不断提升自己的技术实力。最后,不要忘记与同行交流和学习。

2024-07-05 16:22:36 1233

原创 当我面完国内20家公司大模型岗位面试,他们叫我卷王

淘天集团的大模型研究将主要围绕两个场景展开:一是搜广推,二是逛逛的内容化。团队组建工作由淘天集团CEO戴珊、淘天集团CTO若海、阿里妈妈CTO郑波等人共同牵头。介绍链接。淘天集团的大模型研究将主要围绕两个场景展开:一是搜广推,二是逛逛的内容化。团队组建工作由淘天集团CEO戴珊、淘天集团CTO若海、阿里妈妈CTO郑波等人共同牵头。介绍链接。

2024-06-29 16:37:19 1690

原创 AI 赚钱的 26 种方法:视频变幻、文案撰写、虚拟直播

Stars:1.0kLicense:这个项目是一个 AI 副业赚钱资讯信息的大合集,主要围绕使用 AIGC 技术生成内容,并分享一些自己的认知。该项目收录了各种利用 AI 技术进行副业赚钱的思路和方法,包括视频变幻、图片创作、文案撰写等多个方面。

2024-06-21 16:25:45 1372

原创 【技术突破】大型模型革新推进——文档图像识别领域见证技术革命

2023年12月31日,第十九届中国图象图形学学会青年科学家会议在广州举行,由中国图象图形学学会主办。该会议的目标是促进青年科学家之间的交流与合作,以提升我国在图像图形领域的科研水平和创新能力。由中国图象图形学学会和上海合合信息(INTSIG)联合承办的《垂直领域大模型论坛》中,专注于探讨大语言模型时代下以ChatGPT为代表的大模型技术对图像图形学领域研究方向或落地应用的潜在价值。包括合合信息丁凯博士在内的多位业内专家对大模型时代文档与图像识别领域的新探索进行了详细介绍。

2024-07-23 09:17:10 595

原创 实战指南:利用LangChain构建高效意图识别系统

Lumos 甚至帮我优化了学习西班牙语的过程。该应用的操作逻辑极其方便。随着我不断深入使用这个应用,我也渐渐发掘出用LLM在浏览器中的新奇用法。

2024-07-23 09:13:29 472

原创 六种策略实现本地高效部署大型语言模型(LLMs)

在处理敏感数据或专有数据时,我们无法从这些工具中获益。因此,我们需要了解如何在本地运行私人 LLM。开源模型提供了一种解决方案,但它们也有自己的挑战和优势。

2024-07-23 09:10:34 467

原创 暑假两个月学习大模型详细路线,学完找一个大模型实习岗位

以下是一个为期两个月的暑假大模型学习计划,旨在帮助您为寻找大模型实习岗位做好准备:第1周:基础知识储备第1天至第3天:学习线性代数、概率论和统计学基础。第4天至第5天:了解机器学习的基本概念,包括监督学习、非监督学习和强化学习。第6天至第7天:熟悉Python编程,特别是数据处理和机器学习库(如NumPy, Pandas, Scikit-learn)。第2周:深度学习入门第1天至第3天:学习神经网络的基本原理。第4天至第5天:掌握TensorFlow或PyTorch框架的基础操作。

2024-07-22 09:48:35 880

原创 掌握大型模型不再难,精选5本书助你从新手到专家——大型模型学习必备书籍推荐

随着人工智能技术的飞速发展,大模型已经成为推动这一领域进步的核心力量。它们通过处理海量数据,学习复杂的模式和关系,为各种应用提供了强大的智能支持。从语音识别到自动驾驶,再到个性化推荐系统,大模型正在不断地改变我们的生活和工作方式。然而,对于初学者来说,大模型的世界可能显得既神秘又难以接近。熟练掌握大模型的知识和技能在未来职场将是一项基本要求。无论是为了提升自己的技术能力,还是为了在职场上保持竞争力,了解和应用大模型都十分有必要。

2024-07-22 09:45:09 441

原创 构建专属知识库:利用llama3和langchain技术,基于RAG模型实现个性化知识管理

LLM存在时效性和幻觉问题,在 [如何用解决大模型时效性和准确性问题?RAG技术核心原理]一文中我介绍了RAG的核心原理,本文将分享如何基于llama3和langchain搭建本地私有知识库。

2024-07-22 09:41:47 802

原创 转战AI大模型开发挑战重重?揭秘高效学习路径,助你顺利求职!

转行AI大模型开发难吗?怎么学才能找到工作?这应该是所有新人都会面临的问题,所以我结合自己的经历,做了一些总结和学习方法,希望能对大家有所帮助。

2024-07-21 16:30:00 562

原创 150页就能让你上手大模型应用开发《大模型应用开发极简入门:基于GPT-4和ChatGPT》

先让我们细细看看这本书有哪些特别之处(因为本书封面上是一种很特别的动物——刺蛇尾,本书别名「蛇尾书」)。

2024-07-21 14:30:00 678

原创 为什么越努力学习越感到焦虑?

相信不断的总结思考,量变终会产生质变,质变之时即是你腾飞之时。

2024-07-21 10:45:00 568

原创 立志投身大模型领域?AI产品经理转行攻略,请查收这份实用指南!

如果你想转行做大模型,作为一名AI产品经理,你可以怎么做呢?或许,你可以先进行自我检测,看看自己是否真的适合转行做大模型。这篇文章里,作者便给想转行做大模型的AI产品经理们提出了一些建议,不妨来看看吧。作为一个产品经理,你可能已经熟悉了一些常见的AI技术和应用,比如机器学习、深度学习、自然语言处理、计算机视觉等。但是,你是否了解什么是大模型?大模型又有什么特点和优势?为什么大模型会成为AI领域的一个重要趋势?如果你想转行做大模型,你需要具备哪些基本素质和技能?你又该如何评估自己是否适合这个领域?

2024-07-20 19:00:00 671

原创 AI领域必读精选:6部名家名作,乘大模型之风,开启学习之旅!

大模型时代,想抓住风口吗?本期书单就来分享,给大家把大模型时代那些事儿讲清楚!放心,入门的同学也可以从最基础的学起~~快来看看有哪些书吧……▊《彭勇,彭旋,郑志军,茹炳晟 著读懂ChatGPT的核心技术、GPT的进化史和创新点详述多模态大模型的核心技术和应用场景让中小公司可以从0到1部署多模态大模型,打开通往通用人工智能的大门本书详细介绍了大语言模型和多模态大模型的发展历史、技术原理和亮点、主要的开源框架、配套工具、部署细则和实战案例。

2024-07-20 13:30:00 1188

原创 利用MetaGPT打造LLM订阅服务,实现智能Agent的全新构建

xxx 是一个用于 xxx 的开源项目。它使用 xxx 技术栈实现,采用 xxx 的实现思路。xxx 是一个用于 xxx 的开源项目。它使用 xxx 技术栈实现,采用 xxx 的实现思路。xxx 是一个用于 xxx 的开源项目。它使用 xxx 技术栈实现,采用 xxx 的实现思路。

2024-07-20 12:00:00 1233

原创 RAG技术进化史:从初级到高级,再到模块化RAG架构的创新发展

RAG 通过整合外部数据库的知识,已经成为一种有前景的解决方案。这提高了生成内容的准确性和可信度,特别是对于知识密集型任务,并允许持续的知识更新和领域特定信息的整合。RAG 通过从外部知识库检索相关文档块的语义相似性计算,增强了 LLMs。AG 研究范式不断发展,RAG 被分为三个阶段:初级 RAG、高级 RAG 和模块化 RAG。初级 RAG 存在几个局限性,包括检索挑战和生成困难。后来提出的 RAG 架构旨在解决这些问题:高级 RAG 和模块化 RAG。

2024-07-19 09:52:15 789

原创 深度解析:Safetensors——新一代模型权重存储格式的全面指南

Safetensors 是一种用于安全地存储张量的新格式,非常简单,但速度仍然很快(零拷贝)。它是pickle格式的替代品,因为,pickle格式不安全,可能包含可以执行的恶意代码。本文简要介绍了模型权重存储新格式 Safetensors,它具备安全、加载速度快等多个优点;并且可以在 HuggingFace 上面看到越来越多的模型使用Safetensors格式进行存储。

2024-07-19 09:49:39 984

原创 专为大学生设计:全能科研大模型,一键实现论文推荐、降重、润色等功能,无需额外提示词!

专为大学生搞科研的大模型,来了。,大学生科研辅导独角兽公司沃恩智慧打造。截至目前,“沃恩智慧”已累计为上万名大学生提供专业的学术指导、学术背景提升服务,包括学业规划、硕博申请、科研辅导、AI全栈课程、科研训练营、论文带读、Kaggle竞赛等。沃恩智慧联合创始人Paul现场演示核心功能:它支持期刊推荐、文献摘要、论文精读、翻译润色、创新点评估、个性化论文推荐、AI降重等科研辅助功能。网页开箱即用,用户只需拖拽上传论文pdf、网页链接、文本需求,甚至不需写额外提示词,就可快速实现上述功能。

2024-07-18 10:31:21 727

原创 逐步掌握最佳Ai Agents框架-AutoGen 十 Web应用

通过Streamlist,快速完成了AutoGen AI助理的Web应用搭建, 让AutoGen 的chat work flow 更形象。

2024-07-18 10:26:02 235

原创 从零开始,一步步教你构建Agent框架的完整指南

Agent的核心思想是使用语言模型来选择要采取的一系列操作。在Agent中,语言模型被用作推理引擎来确定要采取哪些操作以及按什么顺序。相比于传统机械或软件被动的“给予输入——>做出输出”的模式,Agent 由于更加强调自主的发现问题、确定目标、构想方案、选择方案、执行方案、检查更新的特性,因此可以被认为是一类拥有“自主智能的实体”,而被广泛称之为智能体。

2024-07-18 10:22:22 1010

原创 Coze + Bot API:实现带自我反思的高质量长文翻译Agent(吴恩达方法)

很多人熟悉的吴恩达老师前段时间发布了一个开源项目,提出了一种利用LLM进行自我反思并完善的自动化长文翻译智能体,并给出了简单的原型代码,在国内也看到了开源RAG平台FastGPT对此流程的实现([一键生成高质量长文翻译,吴恩达新方法颠覆传统!。于是我们尝试在Coze平台上类似的实现一个翻译智能体,本文将简单分享这个过程。Translation-agent工作流程我们都知道借助LLM与提示词可以很简单的让模型将一段文本从一种语言翻译成另外一种语言,而且一般质量还不错。

2024-07-17 09:42:51 717

原创 Prompt Engineering技术大全

提示工程,就是创建一堆指令,提示(询问、指导)ChatGPT 这类语言模型输出语料文本。提示工程帮助用户控制语言模型输出,生成适合的特定需求。

2024-07-17 09:40:00 807

原创 LLM 应用开发平台特训

引言随着人工智能技术的飞速发展,大型语言模型(LLM)如 GPT 系列已成为构建智能应用的重要基础。LLMOps(Large Language Model Operations)作为管理 LLM 支持的应用程序生命周期的工具和最佳实践,正逐渐受到业界的广泛关注。在 LLMOps 项目中,前端开发作为用户交互的直接层面,其开发约定及规范的制定尤为重要。本文将从学术研究的视角,探讨 LLMOps 项目前端开发约定及规范的重要性、具体内容及实施策略。LLMOps 项目前端开发的重要性。

2024-07-17 09:37:01 653

原创 2024.7月最新AI大模型一站式系统(支持豆包Doubao-lite-4大模型),AI视频生成系统、AI绘画系统源码、AI智能体、一站式AIGC解决方案

GPTs应用+Prompt自定义预设应用、可全网搜索使用文生视频/图生视频 可生成15秒视频。

2024-07-16 09:56:16 579

原创 人工智能与机器人学的未来:智能自主系统的融合创新

引言人工智能(Artificial Intelligence, AI)和机器人学(Robotics)是现代科技的两大支柱,正在迅速改变我们的生活方式和工作模式。人工智能是研究和开发模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门科学,旨在让机器具备感知、学习、推理和决策等智能行为。而机器人学则是涉及机器人设计、制造、控制、应用和运用的多学科交叉领域,通过集成机械工程、电子工程、计算机科学和其他相关技术,使机器人成为能够感知环境并执行特定任务的智能装置。

2024-07-16 09:51:18 668

原创 自学AI(大模型)

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;第29-32天:选择一个开源大模型项目,如Hugging Face的模型,进行深入研究。

2024-07-16 09:47:42 668

原创 大型模型的科普指南(持续更新版)

大模型是指具有数千万甚至数亿参数的深度学习模型。当我们提及大模型时,通常指的是大语言模型(Large Language Model,简称LLM),即文字问答模型,其典型代表便是OpenAI的GPT系列。然而,随着技术的日新月异,大模型已经不单单局限于自然语言处理(Natural Language Processing)领域的发光发热,而是逐渐渗透到了其他多个领域。

2024-07-15 10:09:43 788

原创 深入解析:大型机器学习模型的基本概念与特点

大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。

2024-07-15 10:03:31 900

原创 一分钟部署 Llama3 中文大模型,没别的,就是快

前段时间百度创始人李彦宏信誓旦旦地说。随后小扎同学就给了他当头一棒,向他展示了什么叫做顶级开源大模型。美国当地时间4月18日,Meta 在官网上发布了两款开源大模型,参数分别达到 80 亿 (8B) 和 700 亿 (70B),是目前同体量下性能最好的开源模型,而且直接逼近了一线顶级商业模型 GPT-4 和 Claude3。与此同时,还有一个 400B 的模型还在路上,估计很快就会放出来,到时候就真的碾压了,😢。

2024-07-14 18:00:00 927

原创 Mac本地部署大模型体验AIGC能力

仅基于Transformer解码器的大模型(图中的蓝色部分),例如,OpenAI的GPT系列、Meta的LLaMa、Google的PaLM等;仅基于Transformer编码器的大模型(图中的粉丝部分),例如,Google的BERT、Meta的RoBERTa等;同时基于Transformer编码器和解码器的大模型(图中的绿色部分),例如,Meta的BART、Google的T5、清华大学的GLM/ChatGLM等。

2024-07-14 17:00:00 537

原创 Meta携手斯坦福等顶尖高校,推出革命性架构TTT,超越Transformer与Mamba!

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!近日,斯坦福、UCSD、UC 伯克利和 Meta 的研究人员提出了一种全新架构,用机器学习模型取代 RNN 的隐藏状态。这个模型通过对输入 token 进行梯度下降来压缩上下文,这种方法被称为「测试时间训练层(Test-Time-Training layers,TTT)」。该研究作者之一 Karan Dalal 表示,他相信这将根本性地改变语言模型方法。

2024-07-13 10:01:06 1265

原创 如何构建心理健康垂直领域对话大模型?

训练方法:心大陆基于专业的 CBT 疏导语料训练的模型,利用先进大语言模型的对话能力、提示学习、上下文学习等技术进行自动数据生成,提高心理数据的规模和多样性,并将自动生成的数据与人工标注数据相结合,利用监督式微调的方式持续优化自有的大语言模型。不过,这种方法在经济和技术上都极为考验企业的能力。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

2024-07-13 09:58:01 878

原创 一时兴起,聊聊当今IT行业的乱象

大的背景是行业寒冬,工作岗位的数量和质量都远远不如之前,造成了打工人卷的飞起的现象,但是从企业端去看,却是面临高端人才不足,低端人才过剩以及招的人数很多但是却满足不了业务需求的问题。本文所描述现象有作者自己的真实经历,也有道听途说但是真实存在的现象~

2024-07-12 09:28:24 1090

原创 打造专属LLM:LangChain大模型应用开发详解

这篇文章就到这里结束了,希望你能够通过这篇文章,了解到如何使用LangChain平台开发基于大模型的应用,以及如何自己封装一个LLM。如果你对LangChain平台或LLM有任何疑问或建议,欢迎随时与我交流。😊。

2024-07-12 09:26:23 626

原创 快速上手LangChain:新手必看的入门教程

LangServe可以帮助开发人员将LangChain应用程序部署为REST API。使用LangChain时不是必定使用LangServe。安装langserve。

2024-07-11 09:36:40 830

原创 大模型入门指南:从零起步,行业入门必读宝典

大模型,顾名思义,就是具有庞大参数和复杂结构的机器学习模型。它能够处理海量的数据,从中提取出有价值的信息,为我们提供决策支持。与传统的机器学习模型相比,大模型具有更高的准确性、更强的泛化能力和更广泛的应用场景。

2024-07-11 09:35:11 291

原创 3K star!为RAG而生的数据清洗神器

OmniParse 旨在成为一个摄取/解析平台,您可以在其中摄取任何类型的数据,例如文档、图像、音频、视频和 Web 内容,并获得最结构化、最可操作且对 GenAI (LLM) 友好的输出。目前来看项目的思路的实用性很不错,当然目前项目在使用上也有一些不完善,比如它擅长解析英语,但对于中文等语言可能会有困难,另外对于PDF中公式转LaTeX会有困难,具体的可以参考项目给出的信息。

2024-07-10 12:52:08 1028

原创 手撕算法拿捏八大神经网络!叫我机器学习大师

八大神经网络通常指的是在深度学习领域具有里程碑意义的八种神经网络模型或架构。这些模型在特定任务上取得了显著的性能,或者在深度学习的发展中起到了关键作用。

2024-07-10 12:49:52 787

原创 报志愿都在劝退,我来安利一下计算机专业

居然还有小老弟问我报志愿的事,站在我个人的成长经历聊一下,只代表我个人看法首先每个专业都有好有坏,网上一搜,360行,行行都骂娘我今天就来安利一下计算机专业如果你家里有啥背景和关系能帮上忙的,就学啥专业,这没啥说的我认为最适合家里啥资源没有普通人的专业,就是计算机,但是由于计算机本身学习有一定的难度 一本以上的同学考会好一些,如果分数不够一本线的话,我觉得找张雪峰老师连线可能好一些首先从就业上来考虑,工科是比文科和理科更实用的,除非你铁了心要考公,但是你要清楚,考公可比进大公司要难得多。

2024-07-09 09:39:14 820

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除