自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Datawhale

一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。

  • 博客(2618)
  • 资源 (5)
  • 收藏
  • 关注

原创 Datawhale团队第三期录取名单!

Datawhale团队公示:Datawhale 组织成员Datawhale已经成立一年半了,从一开始的12个人,学习互助,到提议建立开源组织,做更多开源的事情,帮助更多学习者,也促进...

2020-09-23 21:17:58 2615

转载 刚刚,OpenAI正式发布o3-pro!

它总是向前看是垂直的,向后看是平坦的,但它是一条平滑的曲线。一千年前,一位自给自足的农民会看着我们许多人的所作所为,说我们所做的工作是虚假的,认为我们只是在玩游戏自娱自乐,因为我们拥有充足的食物和难以想象的奢侈品。另外,根据模型文档,o3-pro 支持文本和图像两种输入模态,上下文窗口大小为 200k,最大输出 token 数为 100k,知识的截至时间为 2024 年 6 月 1 日,所以它本身并不具备近一年内的信息,但用户可以通过搜索和知识库等工具为其提供更多上下文。更多的人将能够创作软件,以及艺术。

2025-06-11 10:52:31 4

转载 消失的Ilya现身多大毕业演讲:AI时代如何生存,这是我的法则

我认为,仅仅通过使用AI,看看今天最先进的AI能做什么,你就能获得一种直觉。显然,我是说,据我所知,今天的AI已经相当大地改变了身为学生的意义。它足够好,让你可以想象:好吧,再过几年——有人说三年,有人说五年、十年,众说纷纭(预测未来有点难)——但无论快慢,AI肯定会持续进步。而且,在我还是多伦多大学的学生时,我们这里所做的AI研究是全世界最顶尖的,拥有最具革命性的想法和最激动人心的工作。但总的来说,通过关注AI的能力,当关键时刻到来时不忽视它,这将产生必要的能量,来克服AI将带来的巨大挑战。

2025-06-10 23:06:20 8

原创 20万奖金,面向大学生的大模型赛事来了!

聚焦大学生真实应用场景,如阅读写作、学术科研、求职就业等细分需求,鼓励大学生以用户视角深度参与,基于星火大模型开发兼具创新性与实用性的垂类大模型应用。在这场变革中,高校开发者勇立潮头,手握创新火种,以技术为笔,正参与描绘人工智能时代的新图景。参赛者可围绕阅读、写作、搜索、聊天、问答等方向,聚焦口语学习、面试招聘、论文写作、学习笔记等一个或多个细分应用场景。我们诚邀全球高校开发者:执代码之剑,扬创意之帆,借星火之光,共启星辰大海的创新征途。,聚焦大学生真实应用场景,征集基于星火大模型的垂直创新应用。

2025-06-09 22:54:38 169

原创 《Happy-LLM》完整PDF首发!一周2.3k+star的大模型“顶流教程”

1. 系统性硬核:7章内容从NLP基础到Pytorch手搓LLama2,再到手搓RAG和Agent,手把手教你“造”大模型!2. 授之以渔:不仅讲理论,更用代码还原每一步!GitHub star数量已经突破2.3k,催更我们都收到了,并在当天安排了制作。转发给 3 个好友,一起快乐学习大模型!从零开始的大语言模型原理与实践教程。成为大模型学习圈的“顶流教程”!成员宋志学、邹雨衡发起,旨在打造。读者催更,PDF版本开放下载。Datawhale开源。为Datawhale开源。PDF 正式开放下载,

2025-06-08 23:59:02 149

转载 李飞飞最新访谈:世界模型即将“降临”

她认为,人类智能的绝大部分都超越了语言范畴,语言在捕捉和描绘真实世界时是一种“有损的途径”,且其本质是“纯粹是生成性的”,自然界中本不存在固有的音节或词汇。他设想,如果将人带入一个房间,蒙上眼睛,仅凭口头描述去完成一项任务,其成功的可能性会非常小,因为语言描述对于传达复杂且要求高准确度的现实而言,是“极其不精确的”。从事的是非常前沿的硬核科技,我需要一位计算机科学家,一位人工智能领域的探索者,他要深刻理解产品、市场、客户以及市场推广策略,并且能够随时随地通过电话或面对面的方式,与我进行深度的智力交流。

2025-06-07 22:29:58 49

转载 新一届ACM博士论文奖正式公布!

其次,他研究了人机协作如何使自我指导的心理健康干预更容易获得、更容易参与,从而增强寻求支持的人的能力。通过一种基于强化学习的方法,并通过对来自最大同伴支持平台的 300 名同伴支持者进行的随机试验进行评估,他证明了基于 AI 的反馈可以帮助支持者在对话中更有效地表达共情。作者在论文中描述了他开发的两个支持心理健康和福祉的人机协作系统,以及此类系统的评估框架。在众多应用中,尤其是密码学领域,我们更需要一种稳健的计算限制,即存在某种特定任务,使得任何受限于低复杂度的算法都无法成功执行,甚至无法做出可靠近似。

2025-06-07 21:15:44 26

转载 Spring AI Alibaba 1.0 GA 正式发布!

在 Agent 生产落地过程中,用户需要解决智能体效果评估、MCP 工具集成、Prompt 管理、Token 上下文、可视化 Tracing 等各种问题,Spring AI Alibaba 通过与 Nacos3、Higress AI 网关、阿里云 ARMS、阿里云向量检索数据库、百炼智能体平台等深度集成,提供全面的智能体企业级生产解决方案,加速智能体从 Demo 走向生产落地。工作流的优势是确定性强,模型作为流程中的一个节点起到的更多是一个分类决策的职责,因此它更适合意图识别等类别属性强的应用场景。

2025-06-06 22:49:16 89

原创 百万奖金池+校招绿通车,金融科技AI顶尖大赛来了!

同时,也欢迎参赛项目根据自身研究方向、研究热点等自行拟定项目选题。从2023年首届举办到现在,两年间,上万支参赛队伍从世界奔赴而来,无数选手用天赋与实力趋光而行,用坚定有力的步伐迈入AI新未来,为金融智能的加速融合和落地贡献力量。欢迎学生、开发者、初创团队等热爱技术的人,加入AFAC大赛选手交流群和钉钉群,你可以第一时间获取最新赛程资讯,与专家在线互动答疑,突破备赛瓶颈。,涵盖智能合规校验、资金流动预测、投研决策自动化、金融推理效能优化四大方向,直击金融合规、流动性管理、资管科技等核心场景的刚需痛点。

2025-06-05 21:59:01 760

转载 OpenAI深夜宣布更新!ChatGPT支持MCP、会议记录

ChatGPT还会根据用户的权限设置,确保只有授权用户能够访问和编辑会议记录,从而在保障信息完整性和可用性的同时,也确保了信息的安全性和隐私性。这些子查询会分别发送到不同的数据源进行搜索,同时考虑到用户对数据的访问权限,确保只有用户有权限查看的数据才会被检索和返回。例如,如果用户查询的是某个产品的销售数据,会优先返回与该产品相关的销售机会和交易记录,而不是其他无关的信息。更重要的是,记录模式不仅记录了会议的原始音频,还通过智能分析生成了关键点、行动项和决策的总结,使得用户在会后能够快速回顾和提取重要信息。

2025-06-05 11:20:22 35

转载 梅宏院士:人工智能模型与开源的几点认识

Datawhale干货 作者:梅宏,中国科学院院士2025年伊始,大语言模型DeepSeek在继2022年底ChatGPT带来人工智能(artificial intelligence,AI)的“现象级”应用之后,再度带来了新一波全球性的大模型应用和讨论的热潮,甚至被视为某些世界性事件的诱因,其中不仅仅有对AI领域中国式创新的热议,还有对AI发展路径的反思和展望。关于DeepSeek对AI发展的贡献,业界基本上有两点共识:一是它通过工程创新大幅地降低了大模型训练和应用的成本;二是它通过开源推动了海量的大模型应

2025-06-04 22:40:46 68

转载 时隔六年!互联网女皇340页AI猛料刷屏,大佬熬夜头秃

2010年,她加入凯鹏华盈(Kleiner Perkins),领导他们的成长基金,随后一举投资了 Facebook、Spotify、Square、Twitter和Snap,见证了它们的辉煌。在这份340页报告中,51次出现「前所未有」这个词,核心要点就是——AI驱动的这场变革已经全面且不可逆转,既是机遇遍地的黄金时代,也是奇点的「关键时刻」!曾经,她是曾是摩根士丹利TMT团队的一员。由此,他们完全跳过了传统应用层,以智能体为中心的体验,将颠覆现在已有的所有互联网技术等级,平台的意义将被消解、重新分配。

2025-06-03 22:24:39 99

转载 AI大神Karpathy分享ChatGPT模型选择指南!

可以说,ChatGPT的记忆系统超越了简单的上下文窗口,通过分层、智能地存储和检索信息,极大地提升了用户体验,让它感觉更像是一个能够学习和成长的智能伙伴。在这背后其实是因为ChatGPT拥有超强的记忆力,而这也是为何ChatGPT命名如此「混乱」的前提下,大家仍然爱用,并且是周活最高的AI工具,没有之一。用户洞察则自动化了这一过程,即使你不明确告知,ChatGPT也能根据你的历史行为自动调整其回应,提供更贴切的解释,避免重复提问。例如,如果你告诉它「我是一名软件工程师」,它可能会保存;

2025-06-03 12:32:25 24

转载 最新对话|吴恩达评AI Agents现状!

但语音就不一样了:时间是往前推进的,你说了就说了,也可以临时改变主意,比如说“我改主意了,忘了我前面说的”,模型其实处理这些的效果还不错。另一方面,工具之间的变化也很快。还有一些其他小技巧,比如说,如果你做的是语音客服机器人,在等待期间播放背景音(比如呼叫中心的噪音),而不是完全的静音,用户就会更容易接受系统的“迟钝”一个很重要但常被忽略的点是:要搭建一个正确的 Eval(评估)体系,不只是评估整个系统的效果,还要能追踪每一步骤,这样你才能快速定位“是哪一步坏了”,“是哪个 Prompt 没有发挥作用”。

2025-06-02 22:00:54 76

转载 面向人工智能,清华大学成立四个新书院,今年开始招生

清华大学党委书记邱勇表示,此次成立四个新的书院,就是为了加快构建清华特色中国书院育人体系,不断发展新的教育理念、教育思想和教育模式,培养国家战略人才和急需紧缺人才,提升对高质量发展的支撑力贡献力,在服务国家发展的进程中成就一流大学的新高度。日,清华大学成立无穹书院、紫荆书院、自强书院、水木书院四个新书院,无穹书院院长由郑力担任,紫荆书院院长由张利担任,自强书院院长由姚强担任,水木书院院长由冯鹏担任。清华大学成立无穹、紫荆、自强、水木四个新书院,新任院长分别为郑力、张利、姚强、冯鹏。

2025-06-02 19:16:22 29

原创 《Happy-LLM》项目正式发布,一起快乐学习大模型!

本项目是一个系统性的 LLM 学习教程,将从 NLP 的基本研究方法出发,根据 LLM 的思路及原理逐层深入,依次为读者剖析 LLM 的架构基础和训练过程。同时,我们会结合目前 LLM 领域最主流的代码框架,演练如何亲手搭建、训练一个 LLM,期以实现授之以鱼,更授之以渔。LLM 是一个快速发展、注重实践的领域,我们建议你多投入实战,复现本项目提供的各种代码,同时积极参加 LLM 相关的项目与比赛,真正投入到 LLM 开发的浪潮中。第5章~第7章是实战应用部分,将逐步带领大家深入 LLM 的底层细节。

2025-06-01 23:50:52 554

转载 陶哲轩:感谢Lean,我又重写了20年前经典教材!

例如,尽管 Mathlib 已具备标准自然数体系,但在第 2 章中,陶哲轩首先以手工方式构建了另一种自然数结构 Chapter2.Nat(若在 Chapter2 命名空间下可简称为 Nat),并推导出与该结构相关的基础结论。特别地,之前用来构建标准数系等的「朴素类型理论」,与 Lean 的依赖类型理论(其中 Lean 对商类型的支持非常出色)非常契合。该书侧重于基础问题,例如自然数、整数、有理数和实数的构造,并提供足够的集合论和逻辑知识,使学生能够进行高度严谨的证明。而陶哲轩本人,也在等待大家的反馈。

2025-06-01 18:35:58 103

转载 从零开始200行python代码实现LLM!

如果学习率大,那么每次更新的多,学习率小,每次更新的就少。的大小为B * T * C,由于我们是Bigram模型,每个token的概率只和它上一个token有关,所以实际上我们只需要计算批次中最后一个token的logit就可以了,但为了和以后的模型统一,依旧保留了这些冗余计算。实现中,我们使用交叉熵函数作为损失函数,且为了满足交叉熵函数对于参数的要求,我们把(B, T, C)的张量,变形为(B * T, C),不需要理解交叉熵函数计算方式,只需知道它得出了两个tensor的差值即可。

2025-05-31 22:20:44 57

转载 Agent也能蒸馏了!性能超好

显示,经过Agent蒸馏的0.5B小模型(参数仅5亿),在投资计算、多跳问答等任务上,性能直接追上传统方法训练的1.5B模型(15亿参数)。论文证明,小模型也能“四两拨千斤”——只要学会用工具,就能在手机、平板上运行智能助手,甚至替代部分大模型场景。传统方法让小模型模仿大模型的“解题步骤”(CoT蒸馏),但小模型容易“开脑洞”——比如硬背答案却不会查资料,或强行心算导致错误。:让大模型先写“解题大纲”,再生成具体步骤。比如解方程时,先写“第一步:整理方程形式”,避免小模型一上来就跑偏。

2025-05-31 18:44:30 58

转载 “AI教父”辛顿最新专访:没有什么人类的能力是AI不能复制的

最近网络上流传着一段视频,展示了一个AI在为某人预订婚礼酒店时,与另一个AI意外“相遇”,它们竟然切换到一种叫“Jiblink”的语言,这种语言对人类来说是完全不可理解的,但据说效率比普通语言高出80%。我们的本性,其实是出于对生存的追求而形成的。举个例子,如果你赋予AI一个核心目标,并告诉它“这非常重要”,然后再给予它其他次要任务,它可能会装出一副正在完成你希望它完成的工作的样子,但其实并没有真正去做。当我感到尴尬时,我的脸会变红,而当AI感到尴尬时,虽然它的“脸”不会变红,也不会大汗淋漓。

2025-05-31 15:25:36 48

转载 Text Diffusion,来了!

LLaDA 做完之后,课题组经过了讨论,决定全力支持开源工作,把一切能开源的代码和权重全都放了出去,并且尽快地回复社区内的所有问题。我们组和非常多 MDM 的人是机器学习出身,特别是 generative model 出身,最初的动机包括 MDM 本身的发展是沿着概率建模的思路的,因此就顺着叫 Diffusion 了(如果往前追到 ICML 2015, 这比 BERT 还早),后来我们确实发现了和 BERT 以及 MaskGIT 的联系,也都在 related work 提到了,并没有人回避这个问题。

2025-05-30 23:53:56 45

转载 斯坦福大学教授李飞飞:未来需要三维世界的基础大模型

Datawhale分享 访谈:李飞飞,斯坦福大学教授5月13日,李飞飞接受海外博客High Signal访谈,本次对话中详细解释了“以人为本AI”的核心内涵、实践维度及其在医疗、教育等多元领域的广阔应用。此外,还聚焦于空间智能AI的前沿进展、三维基础模型的未来构想、开源生态对行业的关键作用,并就如何辨别AI发展中的真实信号与潜在风险,以及构建健康、可持续的AI生态系统等议题展开交流。李飞飞指出,空间智能作为整体智能及未来AGI的关键组成,通过对三维世界的建模、理解与交互,将为内容创作、互动体验、机器人技术及

2025-05-30 17:33:12 54

转载 RAG 挑战赛冠军方案解析:从数据解析到多路由器检索的工程实践,推荐阅读!

因此,我们卷起袖子,彻底研究了库的源代码,并重写了几个方法以满足我们的需求,从而在解析后得到了一个包含所有必要元数据的 JSON 文件。最终,赢得 RAG 挑战赛并非因为找到了某个神奇的解决方案,而是因为采取了系统化的方法,深思熟虑地结合和微调了各种技术,并深入钻研了任务细节。关键的成功因素包括高质量的解析、高效的检索、智能的路由,以及——最值得一提的——LLM 重排序和精心设计的提示词,这些使得即使使用紧凑的模型也能取得出色的结果。模型的认知能力是有限的,额外的规则会分散其回答核心问题的注意力。

2025-05-29 22:36:04 72

转载 刚刚,新版DeepSeek-R1正式开源!

船每次只能载他和一样物品。最终DeepSeek的成果还贴心的设计了参数控制面板,以及速度方向指示,是真的很强,以上所有代码都是提示之后一遍过,没有任何的Debug过程。我给他了一个非常无厘头的族谱问题:「我的妈妈的爸爸的儿子的侄女的孙子的爷爷的舅舅的外孙女的姑姑,是我的谁,你能画出关系族谱图吗?注意,R1的表现之所以如此惊人,是因为它返回的两个文件在第一次都能运行良好,不用编辑,不用重试,这极其少见。设计一个新智元的官方网站,对于这种相对容易的任务,DeepSeek-R1-0528只需要10s的思考时间。

2025-05-29 11:18:28 263

转载 Llama核心团队大面积跑路:14人中11人出走,Mistral成主要去向!

但随着众多原始架构师的离去,以及竞争对手在开源创新方面进展更快,Meta 如今面临的挑战是:在没有原有团队的情况下,如何捍卫其在早期建立的领先优势。这 11 位已离职的作者在 Meta 的平均任期超过五年,这说明他们并不是短期雇佣的人员,而是深入参与 Meta AI 工作的资深研究人员。在 Meta 内部,其研究团队也经历了一次重组。Meta 在 AI 领域投入了数十亿美元,但至今仍没有推出专有的「推理」模型,人们逐渐转向使用提供更先进功能的模型,Meta 在开源领域与竞争对手的差距也变得更为明显。

2025-05-28 22:18:26 38

转载 微软副总裁在X上开课了!连更关于RL的一切,LLM从业者必读

从本质上看,预测下一个 bit 的过程实则是一种自由能(熵)最小化的过程,简而言之:在趋于无序的世界中创造有序。大语言模型是一个概率模型。这种在对大语言模型的权重进行最大化的同时对其输出进行求和的方法,被称为最大期望效用,这也是博弈论中理性主体所采取的做法。为了得到第一个蒙特卡罗估计值,我们使用来自行为策略 pi_old 的样本 a^i ,但是如果我们想要保持估计的无偏性,对于第二项(即 KL 散度项)的蒙特卡罗估计应该使用来自 pi_theta 的样本 a^i ,而不是来自 pi_old 的样本。

2025-05-28 20:37:52 39

转载 【万字长文】大模型开源开发全景与趋势解读

它们日薄西山的原因背后,也反映了 AI 开发领域的市场分化:已经成熟的商业产品(Copilot、Devin、Cursor 等)和开源工具瓜分了市场,功能同质化或迭代缓慢的项目(如 Devika、GPT-Pilot)难以生存,而像 GPT Engineer这样早期积累了大量用户的明星开源项目,也通过开源的成功实践而发展为闭源的商业化产品:开源项目 GPT Engineer 作为热门的 AI 应用构建产品 Lovable 的前身,由于背后团队注意力的转移,如今已经不再继续维护。

2025-05-28 13:43:27 67

转载 产学研深度联动!1.6万人参赛,世界人工智能大会颁奖,第三届世界科学智能大赛构建科创生态圈

本届大赛由上海市科学技术委员会、上海市发展和改革委员会、上海市经济和信息化委员会、上海市教育委员会等多部门联合指导,上海科学智能研究院(下称上智院)和复旦大学联合主办,阿里云计算有限公司、中国南方电网电力调度控制中心、上海市漕河泾新兴技术开发区发展总公司、上海复星医药(集团)股份有限公司、晶泰科技、艾昆纬企业管理咨询(上海)有限公司等机构协办,以“更产业、更开放、更年轻”为核心亮点,设立五大赛道。随着赛程的推进,这场融合科技、产业与教育需求的科学智能盛宴,正吸引着各界更来越多的关注。本届大赛立足“更年轻”

2025-05-28 11:40:09 69

转载 吴恩达:如何在人工智能领域打造你的职业生涯?

给你的雇主充足的时间,在最后的工作时间里全力以赴,尽你所能完成未完成的工作,以一种尊重你所承担的责任的方式离开。我的很多朋友都成功地从事技术而非管理方面的职业,他们能够通过运用深刻的技术洞见来帮助指导项目,例如,在何时投资于新的技术架构或收集更多某种类型的数据,这让他们成长为领导者,并显著改善了项目。在你的职业生涯中,你会从事多个项目,所以你有大量机会来完善你对什么是有价值的想法。鉴于人工智能项目的巨大数量,与其采用传统的“准备,瞄准,开火”的方法,你可以采用“准备,开火,瞄准”的方法来加速你的进步。

2025-05-27 22:35:43 43

转载 总结!2025年大模型Agent RL训练多轮planning技术

OTC-PO是一种简单而有效的基于强化学习 (RL) 的方法,它使大型语言模型 (LLM) 能够学习对外部工具使用的精确且自适应的控制。算法使用的是PPO和GRPO,模型使用的是qwen-0.5b-instruct,用的是verl框架,为了将 StarPO 付诸实践,构建了RAGEN,这是一个用于在受控环境中训练 LLM agent的完整系统。然而,针对工具使用的奖励设计面临着独特的挑战:多个工具可能以不同的参数调用,而粗粒度的奖励信号(例如答案匹配)无法提供有效学习所需的细粒度反馈。

2025-05-27 20:12:37 135

转载 比甄嬛还狠!奥特曼「千面人设」被揭穿,MIT华人记者7年曝黑幕

而在AI信徒眼中,代码能力的飞跃象征更宏大的未来——只要数据足够,万物皆可计算,AI终将掌控一切。通常情况下,当两个团队在战略上意见不合时,大家会希望CEO出面「当裁判」,表明一个明确的方向,哪怕有些人不满意,也要做出一个统一的决策。今天的OpenAI,早已背离了它当初的承诺。「加速派」也许是有意为之,而「末日派」可能是无心插柳,但他们的共同作用,是把AI的规模推向前所未有的高度与速度。于是,两人一起创建了OpenAI,一个非营利机构,目标是成为一个与谷歌对抗的力量,在AI研究中倡导透明与责任。

2025-05-27 15:31:31 28

转载 刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿

其实,分享出这个视频的,是前谷歌DeepMind员工Stephen Roller,后来,他又跳到了Character AI,现在来到了Thinking Machines Lab。但我们对ChatGPT的愿景,是让它无论你身在何处,都能陪伴你的整个生活。而且,他还发现了一件事,就是很多人在训练出不错的模型但达到瓶颈后,通常不会尝试分支搜索,即不会把这个模型衍生出几个不同学习率的训练路径。我们希望ChatGPT成为█████████████████████████████████████████████。

2025-05-26 22:01:21 34

转载 再见AI Agents,你好Agentic AI!

通过对比分析,详细列出了AI Agents和Agentic AI在多个维度上的关键区别,包括定义、自主性水平、任务复杂性、协作方式、学习和适应能力以及应用领域。:AI Agents在其特定任务内具有高自主性,而Agentic AI具有更高的自主性,能够管理多步骤、复杂的任务。:AI Agents是执行特定任务的自主软件程序,而Agentic AI是多个AI代理协作以实现复杂目标的系统。:AI Agents通常处理单一、特定的任务,而Agentic AI处理需要协作的复杂、多步骤任务。

2025-05-26 19:16:36 47

转载 全球第一AI科学家天团,首战封神!2.5个月找到治盲新药,医学圈震撼

团队介绍说,为了生成针对干性AMD的新型治疗候选药物,他们创建了一个管线,把三个智能体Crow、Falcon(文献综述智能体)和Finch(原型数据分析智能体)连接了起来。AI科学家智能体,这次直接包办了写论文所需的全过程,人类根本无需插手——它生成了假设、设计了实验、分析了数据、进行了迭代,甚至为论文制作了图表。中间的Ali,是一名临床科学家,正在公司建立药物研发管线。这应该是人类首次做到,让AI将假设生成、实验和数据分析以闭环的形式连接起来,这也标志着,智能体推动的科学发生速度,从此会大幅加快!

2025-05-26 12:15:25 52

转载 港科大宣布:无条件录取哈佛国际生!

此外,科大在全球大学就业能力排名中,一直位处全球首30名以内,反映毕业生极具竞争力。在研究及创业创新方面,逾八成的港科大研究,于香港的大学教育资助委员会最新的“2020研究评审工作”被评为“国际卓越”或“世界领先”水平。我们已准备好迎接哈佛学生加入科大社群,为成就他们在其学术领域的追求,尽力提供所需的教学资源与生气盎然的学习环境。据了解,香港科技大学是国际知名的大学,致力推动创新教学、卓越研究及具影响力的知识转移。据介绍,作为全球顶尖大学之一,港科大希望提供此机会,让优秀学子能无间断地追求学术理想。

2025-05-24 09:13:10 36

转载 MCP + 数据库,一种比 RAG 检索效果更好的新方式!

MCP Host,比如 Claude Desktop、Cursor 这些工具,在内部实现了 MCP Client,然后 MCP Client 通过标准的 MCP 协议和 MCP Server 进行交互,由各种三方开发者提供的 MCP Server 负责实现各种和三方资源交互的逻辑,比如访问数据库、浏览器、本地文件,最终再通过 标准的 MCP 协议返回给 MCP Client,最终在 MCP Host 上展示。但事实和想象还是有差距的,大家在实际尝试后可能会发现,RAG 的精准度似乎没有那么好。

2025-05-23 23:03:38 32

转载 凌晨,首个下一代大模型Claude 4问世,连续编程7小时,智商震惊人类

Claude Opus 4 是 Anthropic 迄今为止最强大的模型,也是全球最强的编码模型,它在 SWE-bench(72.5%)和 Terminal-bench(43.2%)基准上均处于领先地位,在需要专注投入和数千个步骤的长时间运行任务中表现出色,并能够连续工作数小时 —— 其性能远超所有 Sonnet 模型,并显著扩展了 AI 智能体的功能。Anthropic 表示,Claude Opus 4 是一款全球领先的编码模型,它在复杂、长时间运行任务和智能体工作流中拥有持续的高性能。

2025-05-23 17:18:44 55

原创 Agent主题百校联动,首场来北大了!

浙大,同济等百所高校,形成国内最大规模的Agent技术高校协作网络。高校覆盖顶尖985院校、地方特色高校及职业院校,旨在打破资源壁垒,推动Agent技术普及化。,聚焦Agent前沿方向,通过通识讲堂、实战工坊和创新赛三大环节,为高校学子提供从理论到实践的全方位学习体验。协同办公的最佳场所。在这里,精通各项技能的通用实习生,各行各业的“领域专家”,任你选择。2025年5月26日,国内规模最大的Agent主题高校活动——“AI+X高校行”首场将在。🌟从回答问题,到解决问题,让 Agent 帮你完成更多的工作。

2025-05-22 23:39:05 254

原创 最热Agent方向,高校活动组织者招募了!

五月到六月,Datawhale将联合扣子空间和 Dify 组织全国最大的 Agent 百校联动线下实践活动,将走进北大、北航、北邮、东财。哈尔滨工业大学、中山大学、湖南大学、苏州大学、华中师范大学、太原理工大学、广州大学等 42 所高校。高校学生或老师:参与高校活动组织和宣传、要求现场参与人数 >30 人。今年四月,AI+X 高校行走进了上海交通大学、同济大学、,和字节跳动、Dify联合提供周边礼物、组织者证书。对于高校行组织者,将提供活动策划方案、Agent主题:AI+X高校联动。

2025-05-21 23:59:02 210

转载 大模型全面爆发,所有榜一都是Gemini!谷歌一夜多线突破!

以上的盘点性介绍还并未穷尽谷歌今年的 I/O 大会上发布、升级或规划的一切,比如他们还推出了 Gemma 3n 的预览版本,这是一个可以在手机、笔记本电脑和平板电脑上流畅运行的开放式多模态模型,可以处理音频、文本、图像和视频。AI 模式今年早些时候开始在 Google 实验室测试,可以说是谷歌功能最强大的 AI 搜索功能,拥有更先进的推理能力和多模态分析能力,并能够通过后续问题和有用的网络链接进行更深入的探索。在接下来的几周内,美国用户将在谷歌搜索和谷歌应用的搜索栏中看到一个新的 AI 模式标签页。

2025-05-21 12:46:03 151

Airbnb 新用户的民宿预定预测-数据集

Airbnb 新用户的民宿预定预测 kaggle比赛完整数据集 主要包含5个csv文件

2018-06-20

Python数据分析与挖掘实战(高清带标签+源代码)

10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。

2018-06-20

机器学习_数学基础_精选教材(概率,线代,微积分)

普林斯顿微积分读本高清中文版 概率论与数理统计 - 陈希孺 MIT线性代数导论_Introduction to Linear Algebra, 4th 每一本都是经典之作,和国内同济版相比,通俗易懂,易于自学。 奠定机器学习数学基础,三本教材就够了!!!

2018-08-09

用Python解决数据结构与算法问题

一本关于python版本极佳的数据结构和算法相关教材 而掌握算法和数据结构是拿到好offer必备的核心技能!

2018-08-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除