- 博客(1332)
- 收藏
- 关注
原创 万字综述:大模型的风还是吹到了神经科学
本文为人工智能研究员Patrick Mineault在美国国立卫生院(NIH)神经伦理工作小组的讲稿,有删改。大模型是AI发展的新产物,本文将简单介绍大模型,并着重讨论其在神经科学领域的应用与风险。作者 · AuthorPatrick Mineault人工智能研究员和神经技术专家Amaranth Foundation 的Neuro AI研究员。Mila人工智能研究所担任高级机器学习科学家。在麦吉尔大学视觉神经科学博士毕业,导师是Chris Pack,并在加州大学洛杉矶分校进行了博士后研究,导师是Dario
2025-05-19 21:53:17
288
原创 颠覆RLHF!TPO让大模型也能“边聊边学”你想要的答案
TPO 展示了一种轻量、灵活、可解释的新范式:不调参数,只用自然语言反馈,就能在推理阶段实现偏好优化。相比于训练时对齐方法,TPO 仅需使用极少计算开销。在已对齐模型上继续提升,在未对齐模型上实现“即插即用”的快速进化, TPO 不仅降低了对齐门槛,也拓展了 LLM 推理能力的边界。更重要的是,TPO 背后的思想具有高度可扩展性:将优化过程“语言化”,再由模型自主理解与执行。这为未来 LLM 的可控性、安全性乃至个性化定制提供了通用路径。展望未来,我们相信 TPO 只是一个开始。
2025-05-19 21:52:37
368
原创 6 款大模型官宣后,生成式 AI 淘汰赛的号角正式吹响了
不得不说,亚马逊云科技是一家充满了惊喜的公司,每一年的 re:Invent,仿佛都在强调一件事:能坐稳云计算市场老大的位置,是有原因的。比如在今年的 re:Invent 上,人们习以为常地关注 Amazon Graviton、关注 Amazon EC2 Trn2……但更大的惊喜,其实出现在演讲中段,由 Amazon CEO Andy Jassy 官宣的六款自研基础模型——Amazon Nova 系列。
2025-05-19 21:52:06
619
原创 爆肝万字!从JanusPro到UniTok,多模态大模型理解与生成的统一之路
随着 GPT-4o 生成能力的爆火,很多人都在研究怎么让模型既能看懂图片、视频(理解任务),又能根据文字生成图片、视频(生成任务)。自回归模型(就是那种一个接一个预测下一个“词”的模型)在这两方面都取得了很大进展,比如现在有很多厉害的文生图、文生视频模型,还有很多强大的多模态大语言模型(MLLM)能理解图文信息。自然而然地,研究人员就想把这两种能力整合到一个模型里,搞一个“全能型”的 MLLM,让它用一套系统既能理解世界,又能创造世界。如何处理任务之间的差距,使用统一的框架处理不同的任务?
2025-05-19 21:51:27
653
原创 人工智能专家谈之一:人工智能大模型发展现状及趋势
面对人工智能(AI)时代,无论从事什么工作,我们都有三个方面的问题需要掌握:技能、认知和动态。技能会在不断的应用中解决。随着技术的快速发展,尽快建立对人工智能的认知架构和了解人工智能发展动态尤为重要。回顾人工智能发展史,自从1956年人工智能的概念提出以来,无数科学家和机构从技术创新到理论体系的建立,付出了艰辛的劳动。在这个漫长的历史中,2022年迎来了革命性的突破。
2025-05-19 21:50:46
366
原创 AI怎样模仿人类大脑的注意力机制?
自然语言处理,就是利用计算机为工具对人类自然语言的信息进行各种类型处理和加工的技术。NLP以文字为处理对象。最早的计算机被发明出来,是作为理科生进行复杂计算的工具。而语言和文字是文科生玩的东西,如何将这两者联系起来呢?为了要让机器处理语言,首先需要建立语言的数学模型。称之为语言模型。ChatGPT就是一个语言模型。语言模型最直接的任务就是处理一段输入的文字,不同的目的应该有不同的模型,才能得到不同的输出。例如,假设输入一段中文:“彼得想了解机器学习”,模型可能有不同的输出:
2025-05-19 21:50:13
426
原创 DeepSeek-V3再发论文,梁文锋署名,低成本训练大模型的秘密揭开了
读完这篇论文,我感觉 DeepSeek 真的是“硬件亲儿子”选手。他们没有选择暴力堆算力,而是用软硬件协同,把每一块 GPU、每一条带宽都压榨到极致。特别是像 MLA 和 MoE 的协同机制,不仅提升了性能,也让训练更省钱、更可持续。对 AI 从业者来说,这篇论文的意义在于它不是告诉你“我们模型多厉害”,而是在说“要想模型跑得快,你得先搞懂背后硬件怎么回事”。这不仅是工程问题,更是一种系统性思维的体现。论文地址附上:https://arxiv.org/pdf/2505.09343。
2025-05-19 21:47:46
686
原创 当安全大模型走过2年后,安全行业被改变了什么?
安全大模型经历两年发展,带来的不仅是技术的突破,更是对整个网络安全行业。安全大模型以指数级的效率提升、可量化的安全效果和快速的技术迭代,在钓鱼检测、流量检测、安全运营、数据安全等核心场景实现,颠覆了传统安全防御依赖 “规则+人力+设备” 的模式,让走向,让安全成为企业数字化转型的重要竞争力。**生成式AI的出现加剧了攻防的不对等。**攻击者利用AI技术批量生成钓鱼邮件、自动化漏洞利用,日均攻击尝试跃升至千万级······当网络攻击的门槛大幅降低、手段日趋复杂和隐蔽,攻防双方的平衡在短期内迅速被打破。
2025-05-19 21:47:08
432
原创 开启智能体和知识库探索之旅:Dify配置连接大模型
本文是Dify访问大语言模型(云端与本地)的零基础操作指南,是我找了一台Win11家庭版的电脑,从头到尾配置的全过程,希望能帮助无软件开发经验的用户快速实现大模型调用。大语言模型按部署方式分为云端API模型和本地私有化模型。Dify对两者均提供可视化配置支持,无需代码即可完成接入。特点:依赖第三方服务商算力,数据需传输至服务商服务器,适合快速验证和轻量级应用。支持服务商:DeepSeek、智谱 AI、文心一言、通义千问等。特点:数据完全本地处理,需自行部署模型服务(如 Ollama),适合高隐私场景。
2025-05-19 21:46:08
394
原创 90%的人不知道:腾讯ima 知识库安装、搭建、使用的详细教程!(建议收藏)
腾讯ima(全称ima.copilot)是腾讯混元大模型团队于2024年推出的。
2025-05-19 21:45:34
572
原创 大神 Andrej Karpathy 亲述:用 AI 编程从零做出一个能赚钱的产品,全过程太真实!
氛围编码 MenuGen 作为一个本地演示是令人兴奋和有趣的冒险,但作为一个部署的真实应用却有点痛苦。构建一个现代应用有点像组装宜家的未来家具。有这些服务、文档、API 密钥、配置、开发/生产部署、团队和安全功能、限速、定价层……与此同时,LLM 对一切的知识都有些过时,它们在你仔细观察时会犯下微妙但关键的设计错误,有时还会幻觉或忽悠你解决方案。但最有趣的是,我在代码编辑器中花费的时间其实并不多。我大部分时间都在浏览器中,在标签页和设置间切换,配置和拼接一个怪兽。
2025-05-16 16:31:17
732
原创 程序员如何用AI搞副业?AI这波创业红利你Hold住了吗
当30%的程序员副业收入超过主业,当AI工具让技术变现效率提升10倍——某大厂工程师用Trae/Cursor AI编程开发,一年赚1000万,你敢信?!连号称不会写代码的独立开发者,利用AI开发,最近在AppStore上还做到了应用付费版Top1的应用,XX补光灯Pro。本文深度拆解。
2025-05-16 16:30:22
754
原创 通义灵码AI程序员深度测评:这些能力体验感拉满!满血版 DeepSeek 玩法大揭秘
随着科技的发展,AI编程,或者说是AI辅助编程,已经成为了每一位程序员的福利。今天我们要说的AI程序员,相对于传统的AI辅助编程工具, AI 程序员具备多文件代码修改(Multi-file Edit)和工具使用(Tool-use)的能力,可以与开发者协同完成编码任务,如需求实现、问题解决、单元测试用例生成、批量代码修改等。
2025-05-16 16:28:55
1048
原创 解锁编程新效率!6款AI编程工具深度剖析,让你开发速度飞起来!(AI编程)
人工智能正重塑软件开发范式,AI编程工具凭借其智能代码生成、高效调试等能力,成为开发者提升生产力的核心利器。本文精选了GitHub Copilot X、Codeium等6款主流工具,涵盖开源免费、企业级安全、国产适配等多元场景,详解其核心功能与适用场景。无论是追求效率的码农,还是需要保障代码安全的,都能从中找到精准匹配的解决方案。文末附避坑指南与工具分类总结,助您在AI时代驾驭代码,更高效地实现创新价值。定位:全能型AI编程助手,深度集成VS Code生态。
2025-05-16 16:27:31
1026
原创 AI写代码又进化!程序员何去何从?
前端有模板,后端用框架,算法靠开源,业务代码用AI……2025年的程序开发,卡点已经不是懂不懂,而是知不知道。”个人开发者赵泽明近日在朋友圈感慨。赵泽明是信息挖掘工具wiseflow的主要作者,这一开源项目在Github收获了超过6600个星,他对第一财经表示,项目大概有60%的代码都是用AI写的。**“多看五年,程序员或许就跟当年的打字员一样,从独立工种变为通用技能了,”**但他补充称,这绝对不是普通人的机会,“就像PPT谁都能做,但能靠做PPT挣钱的有几个?
2025-05-16 16:26:44
923
原创 AI味儿越浓的代码,越是顶尖程序员的标配,你信吗?
在工业化时代,流水线的自动化程度越高,产出效率就越高。标准件的组装,不仅大大降低了人为失误的概率,还极大提升了规模化生产的边际收益。某种程度上,自动化的“味儿”越浓,其溢价就越高,而这背后是极其聪明和科学的顶层设计。而在AI时代,数字产品似乎也正朝着类似的方向狂奔——只不过,这次的生产线不是钢铁机械臂和传送带,而是Prompt、MCP、Agent 和LLM。你只需要规划好需求、设计好输入输出、定义清晰的架构和边界,AI就能“流水线式”地生成你要的功能实现。
2025-05-16 16:26:13
623
原创 程序员用AI写代码被开除:你以为的神器可能是坑王?
上个月,硅谷一家公司开除了用Copilot写代码的程序员。这事儿在程序员圈炸了锅——用AI写代码不是行业常态吗?怎么突然就变"高危操作"了?
2025-05-16 16:24:17
942
原创 【Cherry Studio配置MCP服务全流程解析:让AI自动调用工具处理任务】_cherry studio fetch
最近 AI 领域真是隔几天就有一个新热度,随着越来越多的使用 MCP 制作的 Agent 产品出现,MCP 这个新名词也频繁刷屏,有着大火的趋势,那么什么是 MCP 呢?MCP 是一种接口协议,由 AI 大模型公司 Anthropic 在 2024 年 11 月推出,它的全称是 Model Context Protocol,即模型上下文协议!它是连接 API 和大模型的桥梁,通过 MCP,我们可以让 AI 模型能够用一种通用的语言和各种不同的工具与服务进行交流,比如浏览器,Excel 表格,网页截图等等。
2025-05-16 16:23:15
609
原创 拿到Offer,租房怎么办?看我用高德MCP+腾讯云MCP,帮你分分钟搞定!_腾讯云 mcp
通过这次尝试,我深刻体会到了技术的力量,尤其是高德地图MCP和腾讯云MCP的强大功能。当我拿到Offer,面对租房这件“人生大事”时,我并没有感到手足无措,反而因为这两个工具的助力,轻松地找到了心仪的住处。高德地图MCP的地理信息服务简直是我的“租房小助手”。输入公司地址后,周边的房源信息一目了然,租金、房型、周边设施等筛选条件让我能迅速锁定目标。而且,它的导航功能还帮我规划好了实地看房的路线,让我节省了不少时间和精力。腾讯云MCP的云开发功能同样让我惊喜。
2025-05-15 17:40:31
759
原创 从个人博客到电商中台:EdgeOne Pages的MCP Server弹性架构×DeepSeek多场景模板实测报告
EdgeOne Pages 是腾讯云推出的一站式边缘开发与部署平台,基于全球边缘节点网络和 Serverless 架构,为开发者提供从代码托管到全球分发的全流程服务。其核心价值在于将边缘计算能力与现代 Web 开发范式深度融合,支持静态站点托管、动态应用开发、边缘函数部署等场景,尤其适合需要快速迭代、全球化加速或低成本运维的项目。与 GitHub、GitLab 等代码托管平台无缝对接,每次代码提交自动触发构建和部署流程。
2025-05-15 17:39:52
824
原创 AIGC时代的新风口!MCP协议引领未来无限可能_aigc mcp
MCP是由Anthropic主导推出的一种开放协议,旨在标准化大型语言模型(LLM)与外部数据源和工具之间的通信。它如同AI领域的“USB-C接口”,通过统一协议连接大语言模型与本地文件、数据库、API等资源,打破数据孤岛,实现“即插即用”的智能交互[1][7][8]。MCP主机(MCP Hosts):发起请求的AI应用程序,如聊天机器人、AI驱动的IDE、个人助理等[1][3][8]。MCP客户端(MCP Clients)
2025-05-15 17:39:18
875
原创 国内最大的MCP中文社区来了,4000多个服务等你体验_mcpserver 中文
MCPServers是一个专注于MCP服务器和客户端的开源平台,致力于帮助开发者发现、分享以及实现各种优秀的MCP项目。作为一个资深开发者,笔者在使用这个平台后深刻感受到它对提升工作效率的巨大帮助。这里没有过多浮夸的宣传,只有坚实的技术基础和完善的文档支持。接下来,我们将深入探索这个平台的方方面面。总而言之,MCPServers作为国内最大、最稳定的MCP中文社区,为开发者提供了一个全面且高效的技术平台。无论你是初学者还是资深开发者,都能在这里找到符合自己需求的解决方案。
2025-05-15 17:38:32
598
原创 百度搜索AI开放计划:助力开发者通过MCP Server连接用户和应用_mcp开放平台
全面开放:无门槛接入与流量支持百度搜索开放平台的一个重大亮点是支持所有类型AI应用的接入。开发者可以通过平台的接口轻松地将智能推荐、语音识别、图像处理等AI应用集成到百度搜索中。这不仅简化了技术接入流程,还提供了免费流量支持,开发者无需再为SEO和流量获取发愁,可以直接享受百度搜索带来的精准流量。百度搜索开放平台的AI开放计划不仅是技术上的创新,也是商业模式的一次突破。通过MCP 和精准的流量支持,百度为开发者提供便捷的接入方式与商业化路径,让用户享受更智能的搜索体验。
2025-05-15 17:38:01
988
原创 百度搜索AI开放计划:助力开发者通过MCP Server连接用户和应用_mcp开放平台
全面开放:无门槛接入与流量支持百度搜索开放平台的一个重大亮点是支持所有类型AI应用的接入。开发者可以通过平台的接口轻松地将智能推荐、语音识别、图像处理等AI应用集成到百度搜索中。这不仅简化了技术接入流程,还提供了免费流量支持,开发者无需再为SEO和流量获取发愁,可以直接享受百度搜索带来的精准流量。百度搜索开放平台的AI开放计划不仅是技术上的创新,也是商业模式的一次突破。通过MCP 和精准的流量支持,百度为开发者提供便捷的接入方式与商业化路径,让用户享受更智能的搜索体验。
2025-05-15 17:37:30
1055
原创 Trae 宝藏功能实测:从 Mcp 搭建天气系统,到 AI 重塑 Excel 数据处理_quickchart-server
最近随着Mcp的爆火,我也开始研究在这个小玩意,但是由于当时好像只能在cursor上面配置MCP,本身由于不喜欢使用cursor,加上不会使用,就没有继续研究这个MCP了,但是呢,最近trae出了MCP这个功能,那我就不得不去尝试下了能让大模型调用各种工具和资源,仿佛变得无所不能,但一顿体验下来,让很多人望而却步的还是其配置。但是呢?我们现在trae里面就能快速进行trae Mcp的部署操作。
2025-05-15 17:36:50
853
原创 【AI大模型】应用开发基础,学到就是赚到!_ai大模型应用开发
1、了解大模型能做什么2、整体了解大模型应用开发技术栈3、浅尝OpenAI API的调用AI全栈工程师:懂AI、懂编程、懂业务的超级个体,会是AGI(Artificial General Intelligence 通用人工智能)时代最重要的人。
2025-05-15 17:35:44
611
原创 蚂蚁百宝箱 3 分钟上手 MCP:6 步轻松构建 Qwen3 智能体应用并发布小程序_蚂蚁百宝箱卡片如何设置
通过以上 6 步,我们已经成功在蚂蚁百宝箱中构建并发布了一个基于Qwen3 + 支付宝 MCP的智能体应用。从智能体创建到插件配置、再到小程序上线,整个过程高效流畅,大幅降低了 AI 应用开发和变现的门槛。需要特别提醒的是:目前蚂蚁百宝箱的 MCP 服务仍处于抢先体验阶段,支付与调用功能仅限开发测试使用,暂不支持正式商用部署。所有支付订单均在测试环境中处理,并将在次日原路退款,请勿用于真实交易或商用上线。
2025-05-15 17:34:52
641
原创 LLM - 深入解析Embedding模型工作原理_vllm模型起embedding模型
这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。高维数据(例如,具有数百万像素的图像)被压缩为低维向量。召回率越高,说明系统漏掉的相关样本越少,因此在医疗诊断中,召回率是一个非常重要的指标,因为漏诊可能会导致严重的后果。大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约。
2025-05-15 17:32:23
785
原创 大模型里面常说的Embedding(嵌入)是什么_嵌入模型有哪些
Embedding(嵌入)是机器学习和自然语言处理(NLP)中的一种关键技术,其核心思想是将高维、离散、非结构化的数据(如文字、图像、用户行为等)转换为低维、连续、稠密的向量表示。这些向量不仅能被计算机高效处理,还能捕捉数据之间的潜在关系(如语义、相似性等)。例如:文字:单词“猫” → 向量 [0.3, -0.8, 1.2, …, 0.5]图像:一张猫的图片 → 向量 [0.7, 0.1, -0.3, …, 0.9]用户行为:用户点击商品A → 向量 [0.4, -0.2, 0.6, …, 0.1]
2025-05-15 17:31:51
1006
原创 9000字。一文看懂Embedding模型
Embedding模型是一种将离散的符号数据(如单词、句子、图像等)映射到连续的向量空间中的技术,这些向量能够捕捉数据之间的语义、结构等关系。简单来说,就是把原本难以直接处理的符号数据,转换成计算机更容易理解和操作的数值向量形式。以自然语言处理中的词嵌入(Word Embedding)为例,传统的语言处理方法中,单词通常以独热编码(One - Hot Encoding)的形式表示,即一个单词对应一个长长的向量,向量中只有一个位置是1,其余位置都是0,用来唯一标识这个单词。
2025-05-15 17:31:21
922
原创 RAG之关键Embedding模型国内外大PK_text-embedding-v3
什么是embedding呢?wikipedia的描述比较抽象,以下是腾讯混元T1的解释:Embedding模型是一种将高维数据(如文本、图像)映射到低维向量空间的技术,通过保留原始数据的语义和特征信息,实现高效计算与相似性分析。其核心原理是通过神经网络训练,将相似的数据点映射到向量空间中的相近位置,例如"猫"和"狗"的向量比"猫"和"苹果"的更接近,从而捕捉语义关联。在huggingface上有一个。
2025-05-15 17:30:33
693
原创 文心快码Coding智能体Zulu正式发布:国内首个多模态AI程序员正式上岗
2025年,Agent 智能体爆发,Coding Agent 代码智能体已是最火、最快落地的赛道,改写着软件开发的范式,像 Cursor、文心快码这样的 AI 编程工具,成为编程效率提升的“杀手锏”。4月25日,百度 Create AI 开发者大会举行,在六大分会场中特设《如何驾驭 Coding Agent》分会场,邀多位产业界、学术界、开发者社区的一线实践者,共同揭秘探讨 Coding Agent 未来。Create2025|《如何驾驭 Coding Agent》分会场。
2025-05-15 17:26:46
790
原创 2025年最值得用的5款AI编程助手:深度选型指南
AI编程助手已从简单的代码补全工具发展为全方位的开发助手。选择合适的工具不是目的,关键是要将其有效整合到开发流程中。先选择一个核心工具深入使用建立完整的代码审查机制保持对代码质量的严格把控持续跟踪工具的更新迭代反馈建议 |AI编程助手已从简单的代码补全工具发展为全方位的开发助手。选择合适的工具不是目的,关键是要将其有效整合到开发流程中。先选择一个核心工具深入使用建立完整的代码审查机制保持对代码质量的严格把控持续跟踪工具的更新迭代🤔 你正在使用哪款AI编程助手。
2025-05-14 16:05:21
939
原创 一天变Java大神?飞算AI工具颠覆编程界,程序员未来何去何从
是敌是友?答案在你手中飞算JavaAI的诞生,既是效率革命的狂欢,也是职业洗牌的开端。拥抱AI者乘风破浪,故步自封者黯然退场。类不可替代的优势。程序员需持续学习AI底层技术(如大模型调优、算法优化),并深耕垂直领域业务知识,避免成为「工具依赖者」。是敌是友?答案在你手中飞算JavaAI的诞生,既是效率革命的狂欢,也是职业洗牌的开端。拥抱AI者乘风破浪,故步自封者黯然退场。2025年的程序员,你准备好成为「AI时代的领航者」了吗?要在这个风口乘风破浪吗?
2025-05-14 16:04:15
557
原创 程序员薪资分水岭!AI+Java=王炸!
面对AI的强势入侵,2025年,Java还能不能冲?今天,播妞斗胆说点实话!******程序员薪资上涨30%-50%**********这场没有硝烟的AI革命,确实已经在重新书写程序员的职业命运:*****√ 阿里云**全面推行AI编程,**程序员人手一个AI助理;√ 字节跳动要求具备大模型开发能力;√ 腾讯、京东、百度开放招聘技术岗,****
2025-05-14 16:03:40
811
原创 秒出代码:最懂程序员的新一代 AI 搜索引擎(免费)
Devv AI史称最懂程序员的新一代 AI 搜索引擎最近在程序员社群里,有个名字被频繁提起——Devv AI。一位做后端开发的朋友和我分享了他的经历:某天凌晨三点,他卡在一个数据库优化问题上,尝试了所有常规搜索工具都无果,最后用 Devv AI 五分钟内找到了可直接复用的解决方案如果你常和技术问题打交道,或许已经发现传统搜索引擎的局限性:广告干扰、无效结果堆砌、专业内容筛选困难。
2025-05-14 16:02:31
728
原创 程序员要失业了吗?带你体验 AI 辅助编程
有没有思考过活到老学到老这句话的现实韵味?随着大模型的出现和应用,越来越多的人开始使用大模型辅助自己的工作和学习,然而依然有很大一部分人,还处在上一个刚刚学会使用智能手机的时代。回头看看我们的父母,他们会使用大模型了吗?我“时髦”的父亲会和豆包没事聊聊天,遇到一些问题时也会尝试性的问问豆包,过年的时候我给父母装上了 DeepSeek 并让他们像和一个什么都懂点的亲朋好友聊天一样随便问问题,也不知这几个月有没有问过。
2025-05-14 16:01:51
828
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人