自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1004)
  • 收藏
  • 关注

原创 火爆全网的厦大团队又出手,177页《DeepSeek等大模型工具使用手册》,质量如何大家自己来评!

介绍AIGC的基本概念、核心技术、发展历程及行业影响,解析其与大模型的关系,列举主流工具(如DeepSeek、文心一言等),并总结提示词设计技巧。

2025-05-08 11:39:07 177

原创 多模态关系网络在金融风控中的应用和落地实践

导读本次分享的课题是多模态关系网络在金融风控中的应用和落地实践。*主要内容包括以下四大部分:*\1. 多模态关系网络在风控中的应用背景\2. 多模态关系网络关键技术\3. 风控中的应用案例\4. 总结与展望01多模态关系网络在风控中的应用背景关系网络也称之为社会网络,是人和企业、企业和企业,以及设备和设备等等之间的联系。关系网络在金融领域的应用非常广泛,基本上每家企业都会将关系网络应用于风控等场景中。传统的关系网络是基于人的基本信息、手机的基本信息等一些结构化数据,这些数据对识别风险的作用相对有限。用户在

2025-05-08 11:25:11 385

原创 斯坦福大学《2025年人工智能指数报告》

八大维度呈现 “创新极化、矛盾激化、融合深化” 特征:研发与技术领域,工业界与学术界、中美之间形成 “量质分野”;责任与经济领域,风险与机遇、投入与产出倒逼治理与转型;科医与政策领域,突破与布局重塑全球竞争规则;教育与公众领域,需求与认知推动体系与共识重构。未来需破解 “创新过剩” 与 “治理赤字”,构建技术、伦理、社会协同的共生生态,方能实现 AI 从 “工具革命” 到 “价值共建” 的跃升。

2025-05-06 14:45:06 819

原创 如何微调你的第一个领域大模型?

微调(Fine-tuning)大模型,就像是给一个已经学富五车的大脑(预训练的基础大模型),

2025-05-06 11:55:59 679

原创 GNN-RAG:用于大型语言模型推理的图神经网络检索

Year: 2024大语言模型凭借其卓越的自然语言理解能力,已成为众多NLP任务的标杆技术。其核心能力源于对海量文本数据的预训练,从而习得通用的人类知识。然而,由于预训练成本高昂且耗时,LLM难以快速适应新知识或领域专有知识,且易产生“幻觉”。知识图谱以结构化形式存储信息,支持动态更新。KG通过图结构捕捉实体间的复杂交互(如多跳关系),广泛应用于知识密集型任务(如问答系统)。RAG通过向LLM输入上下文注入来自知识图谱(KG)的实时准确信息,缓解LLM的幻觉问题。:多跳问题需遍历复杂路径。

2025-04-18 11:19:10 795

原创 开源零标注Agent工业检测(附论文源码)

吴恩达团队最近开源的 Agentic Object Detection(AOD)技术通过智能代理(Agent)系统,实现了无需标注数据的目标检测。AOD 仅需用户输入文字提示,即可精准识别图像中的目标并定位其位置和属性。例如,用户可以输入指令“帮我找到图中所有未成熟的草莓”,其就会识别图像或视频中所有符合条件的目标。

2025-04-12 11:31:53 696

原创 吴恩达的翻译Agent项目,复现教程来了!

LangGraph是一个用于构建有状态、多角色应用程序的库,特别适用于与大型语言模型(LLMs)一起使用。它扩展了LangChain表达式语言,允许以循环方式协调多个链或角色,其灵感来源于Pregel和Apache Beam,并借鉴了NetworkX的接口。吴恩达老师的项目地址:https://github.com/andrewyng/translation-agentTranslation Agent 是一个基于大型语言模型(LLM)的翻译工具,它采用反思工作流来提升翻译质量。

2025-04-12 11:31:15 944

原创 多智能体协作困境如何破解?谷歌 A2A 协议让 AI 代理“无障碍沟通“

多智能体系统是由多个能够感知环境、做出决策并相互协作的智能代理组成的网络。例如,在智能工厂中,不同 AI 代理分别负责生产调度、质量控制和设备维护,共同优化整体运营。

2025-04-11 14:16:39 1021

原创 一文搞懂大模型数据标注(Label Studio)

* Label Studio是一个开源的数据标注和数据管理平台,由Human Signal开发并维护。它旨在提供一个直观、灵活且可扩展的平台,**

2025-04-11 12:03:04 1480

原创 一文带你了解RAG(检索增强生成) | 概念理论介绍+ 代码实操

RAG(Retrieval Augmented Generation, 检索增强生成)是一种技术框架,其核心在于当 LLM 面对解答问题或创作文本任务时,首先会在大规模文档库中搜索并筛选出与任务紧密相关的素材,继而依据这些素材精准指导后续的回答生成或文本构造过程,旨在通过此种方式提升模型输出的准确性和可靠性。RAG 技术架构图介绍:富文本 主要存储于 txt 文件中,因为排版比较整洁,所以获取方式比较简单【版面分析——富文本txt读取】

2025-04-10 11:38:09 804

原创 Java + LangChain = 王炸!

在本教程中,我们将详细探讨。

2025-04-09 11:59:46 748

原创 懒人提示法:吴恩达提出新AI交互趋势,提示词越简单效果越好

*Lazy Prompting(懒人提示法)**是指在与LLMs交互时,提供最少的信息或问题,让模型自行理解并生成响应,而无需复杂的提示设计。这一概念由AI大牛吴恩达(Andrew Ng)推广在他的公开信 The Benefits of Lazy Prompting[1]中首次提出,并在他转发到X[2]后,在AI圈获得了热烈的讨论和积极的评价。吴恩达指出,在某些情况下,

2025-04-09 11:40:02 1052

原创 DeepSeek接入个人知识库,最新安装包发布,确实可以封神了!

今天跟大家汇报下DeepSeekMine软件最新进展,同时发布最新版V6.1软件安装包。对于第一次看到 DeepSeekMine 的朋友,简单介绍一下,这是我们一直在开发的个人知识库工具,它集成了外部知识检索与大模型生成能力。

2025-04-08 21:30:12 1720

原创 新思路!港大&华为诺亚 | 提出扩散语言模型:Dream-7B,性能媲美DeepSeek-V3-671B

语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。但最近,这种印象正被打破。更多的研究者开始探索。港大和华为诺亚的一项研究就是其中之一。他们刚刚发布的扩散推理模型Dream 7B拿下了开源,在各方面都大幅超越现有的扩散语言模型。

2025-04-08 21:22:35 767

原创 Cursor压力山大:VSCode 3月更新,原地化身免费AI代码编辑器

2025年3月,微软为VSCode带来了两项革命性的AI功能更新——Agent模式和MCP接入支持。这标志着VSCode正式从"智能编辑器"向"AI编程平台"的转变,也让开发者能够在任何环境下都能获得媲美Cursor、Windsurf等专业AI编辑器的体验。本文将深入解析这两项功能,并通过实际案例展示它们如何改变我们的编程方式。这两项功能的结合,意味着开发者现在可以在任何能运行VSCode的环境中(如客户现场、远程支持等)获得完整的AI编程体验,而无需安装额外插件或担心账号安全问题。

2025-04-07 11:30:14 1297

原创 LLM每周学术/资讯最前沿! | 涉及Llama4、DeepSeek最新研究、强化学习、大模型Agent应用等

紧跟技术发展趋势,快速了解大模型最新动态。、强化学习Dr.GRPO、、音乐生成、LoRA迭代升级等热门研究及资讯。。该系列包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。所有这些模型都经过了大量未标注的文本、图像和视频数据的训练,以使它们**「具备广泛的视觉理解能力」**。

2025-04-07 11:18:00 457

原创 深度探索:DeepSeek与鸿蒙HarmonyOS应用开发的深度融合

DeepSeek是一个专注于AI模型开发与部署的平台,支持多种深度学习框架(如TensorFlow、PyTorch)的模型转换与优化。它能够将复杂的AI模型高效地部署到端侧设备上,满足实时性与资源受限场景的需求。本书以讯飞星火认知大模型为例,全面系统地阐述其基础知识、操作方法与技巧,以及相关实战案例。全书共分为12章,第1章为新手入门篇,为读者铺垫了讯飞星火认知大模型(以下简称讯飞星火)的基础知识;第2至第4章为基础操作篇,提供了讯飞星火的基础操作、对讯飞星火插件的探索以及讯飞星火指令集的详解;

2025-04-02 10:56:09 617

原创 DeepSeek部署入门教程!基于Ollama+Chatbox零成本部署DeepSeek-R1,赶紧收藏!

在人工智能领域,DeepSeek 作为国产大模型的第一梯队选手,凭借其卓越的算法优化和高性能表现(支持代码生成、数学推理、多轮对话等场景)持续领跑行业。然而,尽管官方提供了免费的网页版服务,但在实际使用中,用户常常面临三大痛点:网络延迟高(尤其是在代码生成场景中)、隐私数据外泄风险以及高峰期服务器响应缓慢。为了解决这些问题,让您享受毫秒级响应速度与绝对数据隐私的双重优势。访问 Ollama 官网下载页面:Ollama 下载链接。下载安装包:下载 安装程序。运行安装程序:右键点击安装包,选择「以管理员身份

2025-04-02 10:30:10 1006

原创 DeepSeek部署入门教程!一键本地推理,DeepSeek-R1 蒸馏模型 + llama.cpp 部署教程!

通过llama.cpp运行DeepSeek-R1蒸馏版模型,您可以在消费级硬件上体验高性能推理。llama.cpp提供了灵活的配置选项,支持多种硬件加速方式,并且易于部署。建议优先使用预编译二进制文件以简化部署流程,并根据硬件配置调整量化参数与GPU层数。如果您需要更高的推理精度,可以尝试运行更大参数版本的模型,但请注意这需要专业级硬件设备支持。希望本指南能帮助您顺利运行DeepSeek-R1模型,享受高效、灵活的本地推理体验!

2025-04-02 10:28:16 838

原创 正在和DeepSeek-V3-0324做个大项目,「氛围编程」简直太疯狂了

最近超火的氛围编程(Vibe coding)你听说了吗?这个概念是由 AI 大神 Andrej Karpathy 提出的,用户只需要自然语言描述,就能生成代码。仅仅过去一个多月,这一术语就迅速席卷了开发者社区,大家开始纷纷整活。刚刚,Hugging Face 联合创始人 Thomas Wolf 表示:打开 Hugging Face 上的 DeepSite 应用,你也可以体验氛围编程了。做出这一研究的是一位名叫 enzostvs 开发者。

2025-04-01 10:54:18 1067

原创 DeepSeek | DeepSeek-V3新版本模型,升级能力速览!

一个专注大模型AIGC方向的公众号。每日分享大模型(LLM)技术、智能Agent,国内外精华论文、NLP基础知识、国际学术、AI发展前沿动态,无论你是AI领域的初学者,还是资深研究者,这里都有你想要的宝藏知识!422篇原创内容公众号DeepSeek-V3新版本:DeepSeek-V3-0324昨夜悄悄上线了。参数量685B的V3,代码数学推理再次显著提升,甚至代码追平Claude 3.7。链接:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324。

2025-04-01 10:53:36 948

原创 智谱上线AutoGLM沉思,OpenAI不再独享Deep Research

快,这个时刻来得太快了,刚刚人在中关村参加发布会!Deeper Research 不再是 OpenAI 专属了智谱全量上了有 AutoGLM 能力的 Deep Research,结合了推理模型的深度研究能力和 Agent 的浏览器使用能力,AutoGLM 沉思既能轻松访问现有 AI 搜索引擎里需要登陆的网页(知网、某书、公众号、某东等),又可以输出结构化的研究报告,单次任务的持续操作时间轻松超15分钟,能解决 Manus 里跟信息搜索相关的复杂任务。关键是免费体验不限量。

2025-03-31 22:17:23 1077

原创 阿里通义RAG团队等提出RAG与长文本对比新框架,助力智能路由决策机制设计

论文标题:LaRA: Benchmarking Retrieval-Augmented Generation and Long-Context LLMs - No Silver Bullet for LC or RAG Routing开源地址: https://github.com/Alibaba-NLP/LaRA随着大型语言模型(LLMs)的快速发展,输入长度限制从最初的4K token到如今普遍支持的128K甚至百万级token输入,“长文本”(Long Context, LC)的定义也在发生着巨变。

2025-03-27 11:50:59 440

原创 用于化学数据提取的大型语言模型

化学和材料科学领域积累了大量的知识,但这些知识大多以非结构化的自然语言形式存在,而结构化数据对于创新和系统化的材料设计至关重要。传统上,数据提取依赖于人工整理和部分自动化方法,但这些方法在多样化的化学和材料研究中面临挑战。随着LLMs的出现,这一领域发生了重大变化,LLMs能够解决未明确训练的任务,为数据提取提供了一个强大且可扩展的替代方案。然而,将LLMs应用于化学和材料科学数据提取时,也面临着独特的挑战,但化学专业知识和物理定律也为验证LLMs输出提供了机会。

2025-03-27 11:49:32 844

原创 垂直类AI Agent智能体开发指南

随着大模型的不断发展与普及,很多人已经明显体会到,大模型LLM在简单的办公场景应用已经非常成熟,但在一些复杂的业务场景,却很难落地应用。要想实现这一目标,需要很多专业的技术支持。由此,催生了大量AI Agent的需求,但是很多人对Agent的理解依旧停留在过去,实际上技术生态的不断发展完善,已经进入到了新的形态。随着Deepseek-R1的开源,使得很多传统公司有机会自己部署大模型,近距离使用高性能AI后,改变了很多人的观念。

2025-03-27 11:43:42 494

原创 vLLM+Qwen-32B+Open Web UI构建本地私有大模型

ModelScope‌是一个由阿里巴巴集团推出的开源模型即服务(MaaS)平台,旨在简化模型应用的过程,为AI开发者提供灵活、易用、低成本的一站式模型服务产品。该平台汇集了多种最先进的机器学习模型,涵盖自然语言处理、计算机视觉、语音识别等多个领域,并提供丰富的API接口和工具,使开发人员能够轻松地集成和使用这些模型。‌官方网站。

2025-03-18 10:57:30 535

原创 deepseek的爆火,会带来失业潮吗?

像我们公司虽然今年招的少,但也会对新招的应届生统一进行AI培训。用任正非先生的话来说就是,今后职场只有两种人,一种是能使用AI的人,另一种是创造AI工具的人。

2025-03-18 10:54:20 310

原创 DeepSeek本地部署+联网搜索+知识库

分享一个在DeepSeek本地部署+联网搜索+知识库的方法。这个方法呢对比前面更加快捷还能联网搜索。操作系统:Windows11 24H2准备工具:Ollama、Edge(微软浏览器)、Page Assist(扩展应用)看过前面关于DeepSeek本地部署的朋友直接跳转(二)可视化(一)、Deepseek本地安装搭建操作步骤:第一步:下载与安装Ollama2、推荐使用motrix或迅雷下载(使用IDM快给我整噶皮了)。

2025-03-17 21:31:39 1184

原创 智慧农业-1459丨智慧农业顶层设计与解决方案(43页 PPT)

该PPT文档围绕智慧农业展开,涵盖建设背景、需求分析、顶层设计、解决方案、案例展示以及保障服务等方面内容,为智慧农业的发展提供了全面的规划思路与实践参考。政策推动:国家出台多项政策,如 2014 年中央一号文件及农业部相关意见,强调加强农产品质量监管、加大农业科技创新、扶持新型农业经营主体、推进农业信息化,以实现农业现代化。农业信息化任务:包含建设国家农业资源基础数据系统等十大任务,旨在提升农业管理、生产、市场信息服务、疫病防控等多方面的信息化水平。

2025-03-17 21:29:39 793

原创 【ChatOCR】OCR+LLM定制化关键信息抽取(附开源大语言模型汇总整理)

替换文心一言。

2025-03-14 10:35:11 471

原创 2025年AI大模型入门教程(非常详细),从零基础入门到精通,从看这篇开始!

在学习大模型之前,你不必担心自己缺乏相关知识或认为。我坚信,只要你有,你就能够掌握大模型,并能够用它们完成许多有意义的事情。在这个快速变化的时代,虽然新技术和概念不断涌现,但希望你能静下心来,踏实地学习。一旦你精通了某项技术,你就能够用它来实现自己的目标,甚至可能找到理想的工作或完成具有挑战性的项目。在众多的技术中,大模型因其强大的的应用而备受推崇。首先,大模型在处理复杂数据和任务时展现出无与伦比的能力,。其次,大模型能够处理大量的数据,这对于数据挖掘、信息检索和知识发现等领域至关重要。

2025-03-14 10:31:41 603

原创 76k star,像写 Markdown 一样画流程图,这个开源工具太牛了!

Mermaid 是一款基于 JavaScript 的图表和制图工具,它使用 Markdown 风格的文本定义和渲染器来创建和修改复杂的图表。Mermaid 的主要目的是帮助文档跟上开发的步伐。以下是 Mermaid 支持的一些主要图表类型:流程图 (Flowchart序列图 (类图 (状态图 (实体关系图 (甘特图 (饼图 (Pie Chart用户旅程图 (Git 图 (Git Graph需求图 (

2025-03-13 10:36:17 1152

原创 “人工智能+”热点法律问题六人谈 | 林北征:从DeepSeek生态看大模型许可证的法律问题

马云:未来20年,AI时代所带来的巨大变革,会超出所有人的想象。出品 | 电商头条 作者 | 王小孟押注AI赛道后,阿里巴巴开始惊艳全球。图源:通义万相Wan公众号,采用了Apache2.0协议,分为14B和1.3B两个参数规格,支持文生视频和图生视频任务全球开发者在Github、Hugging Face、魔搭社区下载体验。此前,根据权威评测集VBench,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置,几天后更凭借诸多优点受到海外用户的好评。其中,

2025-03-12 11:38:39 1084

原创 马云太牛了,阿里大模型拿下全球第一

马云:未来20年,AI时代所带来的巨大变革,会超出所有人的想象。出品 | 电商头条 作者 | 王小孟押注AI赛道后,阿里巴巴开始惊艳全球。图源:通义万相Wan公众号,采用了Apache2.0协议,分为14B和1.3B两个参数规格,支持文生视频和图生视频任务全球开发者在Github、Hugging Face、魔搭社区下载体验。此前,根据权威评测集VBench,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置,几天后更凭借诸多优点受到海外用户的好评。其中,

2025-03-12 11:29:45 1197

原创 一文说清楚什么是AI Agent(智能体),零基础入门到精通,看这篇就够了!赶紧收藏!

AI Agent,即人工智能代理,一般直接叫做智能体。它是一种能够感知环境、做出决策并采取行动的系统。这些系统能够执行被动的任务,也能够主动寻找解决问题的方法,适应环境的变化,并在没****有人类直接干预的情况下做出决策。例如,一个自动驾驶Agent:可以感知周围的交通情况、道路状况等信息,这就是感知环境根据感知的信息制订下一步的行动计划。例如,决定是否加速、减速、转弯等,这就是做出决策根据决策控制汽车的加速器、刹车、方向盘等,这就是采取行动。

2025-03-10 22:03:47 1195

原创 2025人工智能爆发,报什么专业才不被淘汰?零基础入门到精通,看这篇就够了!赶紧收藏!

2025春节期间,Deepseek和宇树科技的机器人火爆出圈,让很多普通人切身感受到人工智能已经袭来。尤其是Deepseek,甚至有文章说“Deepseek能让张雪峰都失业”。虽然Deepseek目前还没夸张到能报高考志愿表这种程度,但的确和之前的人工智能(AI)聊天助手相比进步了一大截,很多文字分析和处理的工作用人工智能来做已经超过普通人类了。近几年每年都有家长会过来问我,“林老师,我给孩子选这个专业,将来会被人工智能(AI)替代吗?

2025-03-10 21:32:05 1983

原创 全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键

算了么」团队拥有深厚的学术和技术背景,核心成员来自清华大学、北京大学以及 Intel、字节跳动等知名企业。团队在分布式资源调度领域深耕多年,曾获 2024 年中国国际大学生创新大赛亚军(金奖,创业组冠军),并已获得奇绩创坛、水木创投等知名机构的投资。早在平台创立之初,「算了么」团队就敏锐洞察到大模型发展的两大趋势:「小型化」与「分布式」。两者均对当前大模型的实际应用落地具有重要的推动作用。

2025-03-08 11:29:18 1002

原创 阿里深夜开源推理模型QwQ-32B,性能比肩R1满血版。

今夜,Manus发布之后,随之而来赶到战场的,是阿里。凌晨3点,阿里开源了他们全新的推理模型。QwQ-32B。本来还有点意识模糊,当看到他们发出来的性能比对图,我人傻了。不是,我没看懂,这特么是个什么怪物。在几乎所有数据集里,QwQ-32B 都已经能跟满血版DeepSeek R1(671B)表现相当了。尤其是作为QwQ-32B 的主攻方向的数学和代码。而且,QwQ-32B在基准测试上的性能跑分,几乎拉开o1-mini一个身位。我人已傻。今天这夜,对我的冲击有一点大。

2025-03-08 11:25:56 1020

原创 一码难求的Manus,聊聊它背后的趋势

因为Manus今天的爆火,我发现已经有一大批疑似AI写的文章开始满天飞,内容越来越离谱。比如,最开始只是说Manus推出了首个通用Agent助手,接着就演变成了“中国推出首个AI智能体,秒杀OpenAI,全球都跪了”这种标题党式的夸张说法。与此同时,也有不少同学问我什么是智能体。从广义上来说,**智能体的概念可以追溯到1950年。

2025-03-07 16:56:57 1384

原创 一手体验首款通用Agent产品Manus - 唯有惊叹。

昨天夜里,深夜惊雷。一个新团队突然发了一个首款通用行的项目:Manus。演示在此,我人直接看麻了。看完我的第一感觉,卧槽,人类又要一败涂地了。这尼玛,就是OpenAI的DeepResearch和Claude的Computer Use的究极集合体,甚至,他还能自己写代码,直接Coding Agent。这特么是什么怪物啊。。。我预想到这一天会来,只是没想到,来的如此之早。Manus在GAIA的评分上,也非常的离谱。已经超越OpenAI的DeepResearch的了,成为GAIA评分第一。

2025-03-06 20:36:51 788

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除