- 博客(320)
- 收藏
- 关注
原创 与大语言模型交互的礼貌语气:技术影响、社会行为与文化意义的多维度探讨
关于是否值得对 AI 保持礼貌的公众意见,几乎和咖啡或红酒的最新研究结果一样频繁变化——这个月被推崇备至,下个月又受到质疑。延续到现实生活中,而是因为他们相信礼貌能够带来更好、更高效的结果。这种假设在用户和研究人员之间都有所流传,提示语的措辞在研究领域被当作一种工具,用于对齐安全和语气控制,而用户习惯也在不断强化和重塑这些期望。前排提示,文末有大模型AGI-CSDN独家资料包哦!例如,2024 年日本的一项研究发现,提示语的礼貌程度可以改变大型语言模型的行为。
2025-05-10 09:32:41
848
原创 全面了解 LLM 微调——如何根据应用场景独特需求定制大型语言模型
截至2023年,大型语言模型(LLM)的发展确实在不断进步,涌现出了多种新的模型,如ChatGLM、Alpaca、Falcon以及Llama 2,还有GPT-4等。这些模型在自然语言处理领域展现出了强大的潜力,它们能够执行各种复杂的语言任务,如文本生成、翻译、摘要、问答等。微调(Fine-tuning)是利用这些大型语言模型潜力的一个重要方面。微调是指在预训练模型的基础上,针对特定的任务或数据集进行进一步的训练,以提高模型在该任务上的表现。
2025-05-10 09:30:33
977
原创 大模型微调揭秘:微调在实际应用中的具体过程和效果
是指经过大量数据训练的神经网络模型。这些模型通常具有非常复杂的结构和大量的参数,可以处理广泛的任务,理解和生成自然语言,常见的大模型有文心、GPT4、LLAMA等。
2025-05-10 09:29:17
689
原创 一文带你了解企业级ai agent应用的6种基础类型
数据分析与商业智能(BI)在中大型企业的日常运营中的重要性毋庸置疑,无论是简单的财务数据分析,还是复杂的客户与运营数据洞察,都需要借助专业的工具。理想中的AI Agent是在丢给他一个工具包与一些知识以后,借助于大模型的理解、推理能力,完全自主的规划与分解任务,设计任务步骤,并智能的使用各种工具,检索知识,输出内容,完成任务。在实际测试中我们发现不同的大模型在这方面的能力是有较大的差异的,而且即使是最优秀的模型,也存在一定的不确定性,比如有时候无法判断出正确的工具。
2025-05-10 09:27:13
744
原创 一文详解企业想运用大模型现阶段的挑战、场景选择和落地方法
但是,我们也看到,大模型在即将过去的一年仍然快速演进,展现出更加强大的文本理解及生成能力,以及复杂任务的推理能力。同时,大模型还缺乏特定领域的知识,包括企业所在行业的专业知识,以及企业内部人才听得懂的“行话”等等。,结合行业领域知识库,解决其中某个特定问题,显著提升专业人士的工作效率,将是一个业务强相关的好场景。实际上,前文所述的“AI助手”,目前要实现端到端的能力,技术成熟度还不够高,大概率会让专业人士失望。企业在应用大模型时,应选择合适的场景,平衡投入与回报,并制定全面的应对策略以实现真正的价值落地。
2025-05-10 09:22:11
954
原创 企业级大模型应用中面临的问题+解答
然后由于初创企业,资金和人力都有限,无法直接配备完善的企业架构,比如说项目经理,产品经理,技术负责人,再加上其它的行政,财务等等。在前面的[千万不要为了节约成本而选择小模型,特别是开源模型]这篇文章中,简单说明了为什么尽量不要选择小模型,然后文章下面有些评论,可能觉得作者说的都是废话,或者模型不好直接换就行了。
2025-05-10 09:08:52
566
原创 什么是AI智能体?如何实现智能体?
AI 智能体(Agent)是一种自主运行的人工智能系统,能够感知环境、做出决策并执行特定任务。它通常以任务驱动为核心,结合人工智能技术,实现高效的交互和智能化的服务。
2025-05-09 10:26:00
711
原创 AI Agents全面解析,技术干货纯享
随着人工智能技术的飞速发展,智能体(AI Agents)正逐渐成为人与大模型(如大语言模型)交互的主要方式。智能体是能够执行任务、解决问题并提供服务的 AI 系统,它们通过模拟人类的行为和决策过程,使得与大模型的交互更加自然、高效和个性化。智能体作为人与大模型交互的桥梁,不仅提高了交互的效率和质量,还扩展了大模型的应用范围。随着技术的不断进步,智能体将更加深入地融入我们的日常生活,成为不可或缺的智能伙伴。
2025-05-09 10:24:38
658
原创 机器学习算法核心价值解析
在人工智能时代,机器学习算法已成为解决复杂问题的关键工具。无论是金融领域的风险评估、电商平台的推荐系统,还是医疗影像的智能诊断,背后都离不开各类机器学习算法的支撑。本文将系统性地介绍机器学习三大类算法及其典型代表,帮助读者构建完整的算法知识体系。
2025-05-09 10:20:58
571
原创 从零开始搭建一个完整的AI开发环境,并创建一个简单的AI应用程序
在本文中,我们从零开始,一步步搭建了一个完整的AI开发环境,并创建了一个简单的AI应用。您学习了如何安装Python、Anaconda、TensorFlow,以及如何使用Jupyter Notebook进行开发。通过这个简单的手写数字识别应用,您不仅学习了AI的基本概念,还亲身体验了AI的应用。AI是一个广阔而充满机遇的领域,希望这个教程能够激发您继续深入学习和探索AI的兴趣。
2025-05-09 10:18:41
683
原创 如何理解 AI Agent 的演变、架构和未来
它们可以动态地处理边缘情况 —— 例如,如果分析 Agent 发现数据质量问题,它可以要求准备 Agent 进行特定的清理,或者如果可视化 Agent 识别出有趣的模式,它可以建议进行额外的分析以进一步探索。这不再仅仅是拥有一个可以提供建议的顾问与拥有一个可以帮助完成工作的同事之间的区别 —— 这就像拥有一个由专家组成的完整团队,代表你无缝地协同工作。AI Agent 自主和协作运行的能力,需要开发和采用标准化的通信协议,以确保无缝的互操作性,并创建复杂的多 Agent 系统。
2025-05-09 10:16:25
837
原创 大家都在用Agent做什么?7种Agent框架对比!国内一站式Agent搭建平台大盘点,一文说清差别!
代理(Agent)乃一种智能实体,具备自主环境感知与决策行动能力,旨在达成既定目标。作为个人或组织之数字化替身,AI代理执行特定任务与交易,其核心价值在于简化工作流程,削减繁复性,并有效降低人力投入与沟通障碍,促进效率与协作的双重提升。简而言之,代理技术让AI成为高效助手,助力个人与组织在复杂多变的环境中更加游刃有余。Agent基础Agent的核心决策机制围绕着动态适应与持续优化展开。
2025-05-09 09:34:02
949
原创 最佳RAG实战指南:18 种不同的 RAG技术核心思想、实现细节以及优缺点全解
在测试环境中,我对上述 18 种 RAG 技术进行了严格评估。各技术在检索准确率、响应速度与实现复杂度方面各有所长,但实验数据清晰显示,
2025-05-08 10:18:53
1405
原创 rag实战指南:检索质量、增强过程和生成质量
此外,为了给大模型尽可能高质量的知识片段,检索器还应该给出尽可能多的相关片段,并且真正有用的片段应该在更靠前的位置,可以过滤掉低质量文本片段。做开发的同学不管用没用过,对 TDD(Test-Driven Development)的大名总归是听过的,类似的,开发大模型应用的时候也应该有个对应的 MDD(Metrics-Driven Development) 的概念,最舒服的姿势肯定是预先定义好业务的场景、用到的数据、设定的指标以及需要达到的分值,然后按部就班的实现既定目标,员工士气高老板也开心!
2025-05-08 10:16:30
712
原创 在centos离线安装ollama和deepseek?看完这篇你就懂了!
在centos离线安装ollama和deepseek?看完这篇你就懂了!
2025-05-08 10:12:56
243
原创 全面解析MCP协议:原理、应用及实现指南
MCP(Message Communication Protocol)是一种基于消息传递的通信协议,专注于解决分布式系统中节点间的数据交换问题。它通过定义统一的消息格式和通信机制,确保信息传递的可靠性和一致性。使用JSON或Protobuf等结构化数据格式,统一消息结构。
2025-05-08 10:10:37
497
原创 MCP是什么? MCP能做什么?看完本文你就懂了
MCP全称模型上下文协议(Model Context Protocol),是由 Anthropic (Claude 模型的主体公司)在 2024 年 11 月 推出并开源的一项创新标准,旨在让大语言模型能够无缝连接至第三方的数据源。
2025-05-08 10:08:22
1276
原创 知识库搭建关键步骤详解,快速搭建属于你的高效知识管理平台
知识库怎么建立不再是技术人员的专利,借助专业工具,新手也能快速上手,实现信息的高效沉淀与共享。如果你也希望为企业搭建一个高效的知识平台,
2025-05-07 10:24:10
636
原创 大模型 Agent 概述
大模型 Agent 是指基于大型预训练模型(如 GPT-3、GPT-4 等)构建的智能体,能够理解和生成自然语言。这些模型通过处理大量的数据进行训练,因此具备较强的语言理解和生成能力,可以在多种任务中表现出色。在不同的翻译场景中,Agent可以翻译为智能体、代理、智能助手等,本文中提到的“智能体”即是Agent。如果把Agent类比成人类,那么大模型相当于大脑,而工具就是四肢。Agent能够通过工具实现与外部世界的交互,而工具通常就是之前介绍过的插件。
2025-05-07 10:20:16
747
原创 一文详解大模型微调
随着大型语言模型(Large Language Models, LLMs)的快速发展,如何让这些通用模型更好地适应特定场景和任务,已成为AI领域的热点问题。大模型微调技术应运而生,成为连接通用大模型与专业应用的桥梁。本文将系统介绍大模型微调的概念、必要性、分类及常见技术方法。前排提示,文末有大模型AGI-CSDN独家资料包哦!大模型微调(Fine-tuning)是指在预训练大模型(如 GPT、LLaMA 等)的基础上,使用特定领域或任务的数据进行二次训练,使模型更好地适应特定应用场景的过程。
2025-05-07 10:15:25
753
原创 多智能体协同的技术突破:从单一任务到全局优化
具身智能(Embodied Intelligence)强调智能体通过物理实体与环境实时交互,实现感知、认知、决策和行动一体化。2025年,具身智能被纳入中国政府工作报告,成为国家战略重点,标志着AI发展进入以物理交互为核心的新阶段。多智能体协同正引领AI从单一任务执行向全局优化、从虚拟智能向具身智能的历史性跨越。MCP协议等标准化技术为多模型协作提供坚实基础,具身智能的产业化落地为AI赋能实体经济打开新空间。
2025-05-07 10:11:17
740
原创 多智能体协作架构模式:驱动传统公司向AI智能公司转型
在数字化浪潮的席卷下,传统公司的运营模式正面临着前所未有的挑战。随着市场竞争的日益激烈,客户需求的快速变化以及业务复杂度的不断攀升,传统公司在缺乏 AI 技术支撑的情况下,暴露出诸多痛点。在决策层面,由于海量数据的处理与分析依赖人工,导致决策效率低下且准确性难以保证。传统的市场调研与数据分析方法,往往需要耗费大量的时间和人力,从收集数据到得出结论,周期冗长,使得公司在面对瞬息万变的市场时,难以迅速做出精准的决策,错失市场先机。
2025-05-07 10:07:38
909
原创 大模型多智能体协同综述
随着大语言模型(LLMs)的最新进展,代理式人工智能(Agentic AI)在现实应用中取得了显著进展,朝着基于多个大语言模型的智能体迈进,实现感知、学习、推理和协同行动。这些基于大语言模型的多智能体系统(MASs)使得一组智能体能够协作解决复杂任务,并以大规模方式实现集体行动,从孤立的模型转向以协作为核心的方法。本文提供了关于多智能体系统协作方面的广泛综述,并提出了一个可扩展的框架来指导未来的研究。我们的框架根据关键维度对协作机制进行表征:参与者(涉及的智能体)、类型(例如,合作、竞争或合作竞争)、结构(
2025-03-18 10:55:26
861
原创 TableAgent 数据分析智能体简介及应用实战
九章云极DataCanvas是一家AI基础软件供应商,致力于为企业训练和应用大模型赋能,通过自主研发的人工智能基础软件产品系列和解决方案,为用户提供人工智能基础服务,助力其在数智化转型中轻松完成模型和数据的双向赋能,低成本高效率的提升企业决策能力,实现企业级AI规模化应用。
2025-03-18 10:53:05
1144
原创 用AI+dify完成前后端开发+数据处理和数据清洗
全程不需要自己写一行代码,我们就完成了前后端开发和数据处理、数据清洗,效率提升肉眼可见。实际上这也是未来的趋势,在AI的加持下,我们每一个人的能力都会被无限放大,早日尝试并习惯高效使用AI才能帮助我们在新时代的变革中保持竞争力。本文转自allv102,如有侵权,请联系删除。
2025-03-18 10:51:06
1382
原创 数据集落地方案总结之预训练数据集以及框架清洗
本文从快速构建大型语言模型(LLM)训练数据集的角度出发,全面梳理了中文、英文和多语种数据集及其清洗规则,介绍了常用的数据清洗框架和主要流程,指出现有数据集存在的问题及其初步解决方案。站在开源数据集的肩膀上,通过数据整合和精细治理,我们能快速产出落地方案和结果,从而推动 LLM 的训练和优化任务。数据类别:已覆盖了所有常见的类别,包括网页、书籍、企业年报、法律文书、问答、新闻、百科、考试、专利、评论、博客、歌词、古诗文、中英平行语料等。训练语种:训练集包含中英双语。
2025-03-18 10:41:56
1850
原创 人工智能数据预处理一文精讲
在自然语言处理(NLP)中,数据预处理,又可称数据清洗,是指将原始文本数据转换成适合机器学习模型处理的格式的过程。前排提示,文末有大模型AGI-CSDN独家资料包哦!根据特定领域的术语或特定的数据集特性,可能需要开发自定义的预处理规则。在以上方法中,我只挑选了部分比较常用且重要的方法进行了详细地分析和讲解并分别给出了代码示例便于大家进一步理解或者运用。数据预处理是NLP任务成功的基础,它有助于提高模型的性能和准确性。预处理步骤的选择和实现取决于具体的应用场景和数据特性。
2025-03-18 10:39:10
699
原创 Meta-CoT:让AI学会“如何思考“
最新研究论文提出了一个突破性的框架——Meta Chain-of-Thought(Meta-CoT),这一方法不仅关注"思考的结果",更注重"思考的过程"。研究团队发现,在复杂问题解决过程中,人类的思维并非简单的线性步骤,而是包含了探索、验证等多维度的迭代过程。更深入的分析揭示了AI是如何"误导"人类的:在问答任务中,模型学会了选择性地引用或虚构证据,构建看似合理但实际有误的论证;这项研究启示我们,让AI具备真正的推理能力,关键在于理解和模拟人类的思维过程,而不仅仅是模仿表面的解题步骤。
2025-03-17 21:26:38
710
原创 百度接入DeepSeek带来了哪些体验升级?
值得注意的是,百度AI搜索在生成内容时,还能够在右侧的“灵感探索”区域,根据用户的当前提问,提供相关的灵感内容,以协助用户梳理问题的脉络,并使用户能够通过一次提问便全面了解问题的全貌。令人惊讶的是,百度AI搜索不仅能注意根据问题中的“日期范围”的筛选结果,同时还能准确回答出提问当天的日期,展示出其对于时间有明确的理解,这对于结果搜索精度而言,能够带来不小的提升。从思考过程来看,百度AI搜索不仅可以给出详细的解题过程,同时还会有检查校对的过程,这是很多“残血版”R1模型所不具备的,可以看出。
2025-03-17 21:24:54
570
原创 多智能体数据分析
想象一下,一个专注于抵押贷款领域的绩效营销公司,生成潜在客户并将其出售给金融机构。每种抵押贷款产品通过五个媒体渠道进行广告宣传——如社交媒体、搜索引擎和电子邮件——并进一步细分为5-7种子类型,例如Facebook、Instagram或Google Ads。这为每种产品创造了至少25个时间序列。将此乘以多个产品,您突然需要每天跟踪数百项指标。现在考虑一个关键指标,比如潜在客户接受率——客户接受的潜在客户的百分比。在大量数据中,这个指标的逐渐下降可能会在几周内被忽视,导致利润损失和被动管理。
2025-03-17 21:22:34
1139
原创 DeepSeek提示词如何深化学术内容
随文附上的是我搜集的相关数据资料。对比不同理论框架下的研究结论,探讨其异同点及背后的理论逻辑,这不仅能展现你对多理论的掌握,还能揭示研究对象的多维度特性。DeepSeek提示词:针对我的研究生论文[论文选题,例如区块链技术在供应链管理中的应用探索],请你构思一个全面的理论体系,要求构建或进一步完善适用于该领域的理论模型,提升论文的理论价值。DeepSeek提示词:假如你是一位[研究领域,例如可持续城市规划]的资深学者,请从全球视野出发,探讨本领域内的最新趋势与未来发展方向,以及与其他学科的交叉融合点。
2025-03-17 21:21:20
407
原创 大模型训练集数据增强是什么?
在深度学习中,数据是模型性能的基石。大规模、高质量的数据集通常能显著提高模型的泛化能力,帮助模型在真实场景中做出更准确的预测。然而,在很多实际应用中,数据收集困难、昂贵或者受限,尤其是当数据集相对较小或标注数据难以获取时,如何提升模型的性能成为了一个巨大的挑战。在这种情况下,数据集增强(Dataset Augmentation) 作为一种有效的解决方案,逐渐被广泛应用于各种深度学习任务中。
2025-03-17 21:17:56
884
原创 大模型数据清洗调优
近期一直在协助做AI大模型数据清洗调优的工作,主要就是使用大数据计算引擎Spark做一些原始数据的清洗工作,整体数据量大约6PB-8PB之间,那么对于整个大数据量的处理性能将是一个重大的挑战,关于具体的调优参数配置项暂时不在本文内容之中,因为调优还在进行时,等事情结束之后,再将相关参数以及说明发布出来。
2025-03-14 11:58:51
795
原创 人工智能技术在数据清洗方面的应用
数据清洗是数据预处理的重要环节,它涉及到数据的去噪、补全、转换等多种操作,以确保数据的质量和可靠性。随着数据规模的增加,手动进行数据清洗已经无法满足业务需求,因此,数据清洗的自动化变得至关重要。人工智能技术在数据清洗方面的应用,可以帮助我们更有效地进行数据清洗,提高数据质量,降低人工成本。
2025-03-14 11:41:15
967
原创 大模型应用之数据资产人工智能
数据资产人工智能(Data Asset AI)是一种利用人工智能技术来管理和优化数据资产的方法。在大数据时代,数据资产已经成为企业和组织的核心资产,其价值不断增长。然而,随着数据的量和复杂性的增加,手动管理和分析数据已经不能满足需求。因此,人工智能技术在数据资产管理领域具有广泛的应用前景。背景介绍核心概念与联系核心算法原理和具体操作步骤以及数学模型公式详细讲解具体代码实例和详细解释说明未来发展趋势与挑战附录常见问题与解答前排提示,文末有大模型AGI-CSDN独家资料包哦!
2025-03-14 11:38:59
432
原创 大模型时代的“三剑客”:智能体(Agent)、AIGC、AGI!
智能体(Agent)就像是餐厅的服务员,能感知顾客的需求,比如看到顾客举手就知道要过去服务,然后根据顾客的要求做出决策,比如给顾客推荐合适的菜品,最后执行任务,把菜端给顾客。它能进行复杂的推理,就像福尔摩斯一样,通过各种线索解开谜团;你可以把它想象成电影《机器人总动员》里的瓦力,它能像人类一样,啥都能干,无论是打扫垃圾,还是和地球人交流,甚至还能有自己的情感和思考。AGI 的目标就是让机器拥有像人类一样的通用智能,能适应各种各样的环境和任务,而不是像现在的很多 AI 那样,只能在特定的领域里“耍大刀”。
2025-03-12 11:59:52
494
原创 大模型微调数据集构建方法
目前大模型的微调方法有很多,而且大多可以在消费级显卡上进行,每个人都可以在自己的电脑上微调自己的大模型。但是在微调时我们时常面对一个问题,就是数据集问题。网络上有许多开源数据集,但是很多时候我们并不想用这些数据集微调模型,我们更希望使用某本书、某个作者的作品、我们自己的聊天记录、某个角色的对话来微调模型。用于微调的数据通常是成千上万的问答对,如果手工搜集,需要花费大量时间。
2025-03-12 11:58:19
1464
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人