
AI文章转载
文章平均质量分 84
网上的重要信息
bylander
这个作者很懒,什么都没留下…
展开
-
【AI学习】李宏毅老师讲AI Agent摘要
在b站听了李宏毅2025最新的AI Agent教程,简单易懂,而且紧跟发展,有大量最新的研究进展。原创 2025-04-15 17:09:40 · 226 阅读 · 0 评论 -
【AI学习】MCP的简单快速理解
最近,AI界最火热的恐怕就是MCP了。作为一个新的知识点,学习的开始,先摘录一些信息,从发展历程、通俗介绍到具体案例,这样可以快速理解MCP。原创 2025-04-04 22:45:56 · 839 阅读 · 0 评论 -
【AI学习】从RLHF到GRPO
最近学习了从RLHF到GRPO的发展变化原创 2025-03-13 09:02:01 · 182 阅读 · 0 评论 -
【AI非常道】二零二五年二月,AI非常道
有关AI非常之言语,即AI非常道!原创 2025-03-13 09:00:00 · 617 阅读 · 0 评论 -
【AI学习】关于Kimi的MoBA
MoBA论文一作、知乎答主【Andrew Lu】的回答详述了研发过程中三次踩坑的经起伏历,被知友形容为「思维链背后的思维链开源」原创 2025-03-12 22:16:44 · 210 阅读 · 0 评论 -
【AI学习】关于 DeepSeek-R1的几个流程图
关于DeepSeek-R1的几个流程图,清晰易懂形象直观原创 2025-02-08 23:11:35 · 3022 阅读 · 0 评论 -
【AI学习】地平线首席架构师苏箐关于自动驾驶的演讲
在地平线智驾科技畅想日上,地平线副总裁兼首席架构师苏箐(前华为智驾负责人)做了即兴演讲,以下是其演讲的主要内容:对自动驾驶行业的看法自动驾驶的难度与挑战:苏箐表示自动驾驶非常难,他做自动驾驶到现在已经快抑郁了,很多优秀的同学都改行了,去做具身智能机器人。他认为自动驾驶是第一个在物理世界跟人交互的机器人,是在一个半规则和半非规则的场景里面的东西,如果连自动驾驶都搞不定,去做完全是非结构化的机器人是不可能的。自动驾驶的价值拐点:苏箐认为自动驾驶系统的竞争对手是人类本身,其价值是一个拐点式的价值。原创 2025-01-15 11:30:33 · 1133 阅读 · 0 评论 -
【AI学习】Hinton老爷子的有趣观点
在人类的记忆模式中,编造事情和回忆事情之间没有明确的界限,记忆某事本质上就是编织一些看似合理的东西原创 2025-01-01 23:26:13 · 807 阅读 · 0 评论 -
【AI学习】Huggingface复刻Test-time Compute Scaling技术
OpenAI ChatGPT o1 背后的关键技术Test-time Compute Scaling,Huggingface实现并开源了!Hugging Face 团队发布了一篇关于“开源模型中的推理阶段计算扩展”(Test-time Compute Scaling) 的研究文章。Hugging Face 团队通过复现 DeepMind 等研究成果,通过测试时计算扩展(test-time compute scaling)来提升小模型的性能,使其在某些情况下超越更大规模的模型。原创 2024-12-21 22:17:38 · 1699 阅读 · 0 评论 -
【AI学习】OpenAI推出o3,向AGI迈出关键一步
2024年12月21日,OpenAI在其为期12天发布会活动的最后一天,正式发布了备受期待的o3系列模型,包括o3和o3-mini。o3 是一个非常强大的模型,在编码、数学以及 ARC-AGI 基准测试等多个基准上超过了 OpenAI 此前的 o1 模型(o1得分25%,o3得分87.5%)。o3-mini 是 o3 更经济高效且性能导向的版本,在成本和延迟方面比 o1-mini 低得多,同时提供类似的功能。原创 2024-12-21 21:39:36 · 1348 阅读 · 0 评论 -
【AI学习】OpenAI研究员Noam Brown:推理计算让我们重回“GPT-2”时代
作为O1项目的核心成员,他从一线研究者的视角,详细阐述了推理计算扩展的一些思考。和Ilya 讲预训练结束的主要原因是数据耗尽原因不同,Noam则强掉了经济性因素——预训练的扩展现在太贵太复杂了,所以难以为继,而推理计算则正处于当年的”GPT-2“阶段,方兴未艾。对于Noam预测,未来可能会出现一个统一模型,这个论点我还是有点怀疑,或者如同生物进化一样,更多类似的智能组织在一起,更为合理。Noam认为,学术界在资源受限的情况下,应该专注于探索具备长期潜力的新技术,而不是在尖端领域与业界竞争。原创 2024-12-18 06:00:00 · 389 阅读 · 0 评论 -
【AI学习】Ilya在NeurIPS 2024的重磅发言:预训练即将终结!
最近,Ilya在NeurIPS 2024的发言引起广泛关注,很多人说这可能是今年最重要的发言。各个自媒体都有相关文章,这里记录作为备忘。原创 2024-12-18 06:00:00 · 1064 阅读 · 0 评论 -
【AI学习】Mamba学习(四):从SSM开始
SSM在推理时,可以类似RNN的循环结构,获得比较快的推理速度;而在训练的时候,可以通过采用卷积核实现并行化,获得较快的训练速读。原创 2024-10-08 23:20:10 · 1255 阅读 · 0 评论 -
【AI学习】Mamba学习(二):线性注意力
Softmax 注意力的问题是,Softmax是非线性的函数,如果没有 Softmax,那么就是三个矩阵 (query・key)・value 连乘 ,而矩阵乘法满足结合率,可以调整为调整为 query・(key・value)。 (query・key)得到是n✖n的矩阵,(key・value)得到的是d✖d的矩阵。在d远小于n的情况下,复杂度就大致从O(n^2)降低到O(n)量级。原创 2024-10-04 22:57:15 · 1246 阅读 · 0 评论 -
【AI学习】Lilian Weng:Extrinsic Hallucinations in LLMs(LLM 的外在幻觉)
这篇文章的核心内容和观点是讨论大型语言模型(LLM)中的外在幻觉问题。外在幻觉是指模型生成不真实、捏造、不一致或无意义的内容。同样重要的是,当模型不知道某个事实时,它应该这么说。文章主要探讨了外在幻觉的原因、检测方法和减少幻觉的策略。原创 2024-09-26 22:25:41 · 1066 阅读 · 0 评论 -
【AI学习】Lilian Weng:What are Diffusion Models?
Lilian Weng博客《What are Diffusion Models?》原创 2024-09-25 22:57:58 · 1151 阅读 · 0 评论 -
【AI学习】陶哲轩在 2024 年第 65 届国际数学奥林匹克(IMO)的演讲:AI 与数学
陶哲轩介绍到被数学家接受并开始普及的方法:形式化证明辅助工具原创 2024-09-15 23:21:51 · 1900 阅读 · 1 评论 -
【AI学习】了解OpenAI o1背后的self-play RL:开启新的智能道路
大模型的预训练,虽然还在继续,但是似乎有点快到智能顶点了,self-play RL,是开启了新的智能道路原创 2024-09-15 21:19:50 · 2348 阅读 · 0 评论 -
【AI学习】LLaMA 系列模型的进化(三):关于LLama 3 405B模型
LLaMA 3 405B让开源闭源性能的两线出现了交点!原创 2024-07-25 22:36:18 · 1414 阅读 · 0 评论 -
【AI学习】简单聊聊后训练(Post-Training)的重要性
模型生成的输出质量比网上的大多数内容都要高。因此,让模型自己思考似乎更有道理,而不仅仅是训练来模仿网络上的内容。所以,我认为从第一性原理上来说,这是有说服力的。我会说,我们通过后训练取得了很多进步。原创 2024-05-17 22:01:38 · 6646 阅读 · 0 评论 -
【AI学习】读《对话丨地平线创始人余凯:战略的本质是不赌》的一些想法
“一个领导者,要替大家把整个平台搭起来,把天花板撑高,大家在上面有很大空间可以发挥,可以挣钱”原创 2024-05-17 21:37:25 · 964 阅读 · 0 评论 -
【文章转载】ChatGPT 提示词十级技巧: 从新手到专家
关于自我提示,大语言模型在给自己出提示时,它往往比人类做得更好。所以,我们只需要让大语言模型制定一个提示词,就能得到我们想要的提示原创 2024-05-08 22:05:48 · 1290 阅读 · 0 评论 -
【AI学习】Ben Thompson对 Nat Friedman 和 Daniel Gross的采访
看到所有这些公司的 CEO 都在吹嘘他们的 MMLU 参数指标(MMLU number, 大规模多任务语言理解基准)是很有趣的,而 MMLU 是丹·亨德里克斯 ( Dan Hendrycks ) 在大学本科时自己开发的一个评估。所以你基本上是看到万亿美元公司的 CEO 在谈论他们在一个本科生推出的测试中的分数,而这是目前最重要的推理评估(the premier reasoning eval)之一。原创 2024-04-27 22:55:20 · 1141 阅读 · 0 评论 -
【文章转载】Meta 宣布推出 Llama 3 的介绍
学习了微博网友@宝玉xp老师最新的文章,文章有很多关于Llama3的细节原创 2024-04-26 21:22:12 · 779 阅读 · 0 评论 -
【文章转载】Lance Martin的关于RAG的笔记
从头开始学习 RAG,看Lance Martin的这篇笔记就行了,包含了十几篇论文和开源实现!原创 2024-04-25 22:50:47 · 1064 阅读 · 1 评论