机器学习
文章平均质量分 90
一头老黄牛@
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
谷歌2025年度研究突破深度解读
Gemini 3 Pro:专业级推理的新标杆Gemini 3 Pro的发布代表了谷歌在大语言模型领域的最高成就。推理能力的革命性提升:Gemini 3 Pro在"人类最后的考试"(Humanity’s Last Exam)这一极具挑战性的基准测试中取得了突破性成绩。这项测试专门设计用来检验AI是否能够像人类一样进行深度思考和复杂推理,其难度远超传统基准测试。模型在GPQA Diamond等学术级别的测试中同样表现出色,证明了其在处理需要专业知识和多步推理任务上的卓越能力。多模态理解的深化。原创 2025-12-26 11:32:49 · 922 阅读 · 0 评论 -
通义万相 (Wan) 2.6 API 可视化调用面板
通义万相图像生成模型支持图像编辑、图文混排输出,满足多样化生成与集成需求。以下是一个基于 React 的。效果图:由于目前通义万相(Wan 2.1/2.0)的视频生成通常是(提交任务 -> 轮询状态 -> 获取结果),这个面板完整实现了这套。原创 2025-12-26 09:06:00 · 2270 阅读 · 0 评论 -
从事实与指标到媒体机器学习:Netflix 数据工程职能的演变
为了支撑下一代媒体分析与机器学习,我们正在 Netflix 构建媒体数据湖——一个专为 Netflix 媒体资产设计的数据湖,并使用先进的向量存储(vector storage)方案。我们与数据平台团队合作,试点将LanceDB集成到我们的大数据平台(Big Data Platform)中。原创 2025-12-25 21:22:20 · 1042 阅读 · 0 评论 -
论文解读|探究古代中国学者与政治家之间的关系:以元祐时期为例
摘要:本文以宋代元祐时期(1086-94)为例,探究古代中国学者与政治家的关系。通过中国历代人物传记资料库(CBDB)收集文学关系(如共同为第三方写作)和政治关系(如政治派系关联)数据,构建两个矩阵并采用泊松-伽马分解模型分析。研究发现学者可分为三组,政治家分为两组及中间派;共同文学活动者更可能共享政治目标,证实了元祐时期文人政治的特征。该研究为理解宋代"唐宋变革"中的政治文化转型提供了新视角。 (148字)原创 2025-12-25 00:18:24 · 1182 阅读 · 0 评论 -
论文解读|无监督词向量从材料科学文献中捕获潜在知识
这篇论文提出了一种无监督方法,通过词向量(word embeddings)从材料科学文献中自动提取潜在知识。研究人员收集了1922-2018年间330万篇材料科学相关论文摘要,使用Word2vec的skip-gram模型训练得到200维词向量。结果表明,这些未经人工标注的词向量不仅能捕捉元素周期表结构等复杂概念,还能预测未来可能发现的材料。研究发现表明,大量科学文献中蕴含着尚未被充分挖掘的知识,这种方法为大规模科学文献挖掘提供了新思路。原创 2025-12-24 20:54:22 · 907 阅读 · 0 评论 -
论文解读|ReMe框架深度解读:经验驱动的智能体动态记忆系统
大语言模型从静态语言处理工具向自主智能体的转变,标志着人工智能领域的关键跃迁。这种转变使系统能够通过迭代推理和工具使用处理复杂动态任务。为了在不进行昂贵参数重训练的前提下实现持续改进,程序性记忆(procedural memory)作为智能体演化的关键基底应运而生。程序性记忆内化"如何做"的知识,通过积累高质量问题解决经验,使智能体能够利用先前的成功和教训来应对新场景,理论上可以减少冗余的试错过程并规避局部最优解。然而,现有框架普遍受困于"被动积累"范式,将记忆视为静态的仅追加档案。原创 2025-12-13 23:26:19 · 865 阅读 · 0 评论 -
论文解读:多模态大模型情绪分析的承诺与现实
目前的多模态 LLM 虽然在“感知文本情绪”上已经非常成熟,但在“用视频做情绪分析”上远未达到同等成熟度,哪怕是在概念上比 arousal 容易得多的 sentiment 任务上也是如此。我们能否用一套统一的多模态 LLM 框架,在不做重训练的情况下,通过 in-context learning 直接从“视频 + 提示词”中抽取“概念驱动的唤醒度测量”?从“数字人文/计算政治学 + 研究方法论”的角度看,这篇论文的价值并不在于给出一个可直接复用的“情绪测量工具”,而在于提供了一个。原创 2025-12-13 20:58:41 · 1042 阅读 · 0 评论 -
论文解读|从“情感陪伴机器人”到“知识中介体”
摘要: 论文探讨如何通过具身AI代理“Suzume-chan”提升知识传播的人情味,解决传统数字工具“去关系化”问题。该软绒机器人结合本地大模型与检索增强生成(RAG)技术,分两阶段运作:专家口头输入知识,访客通过自然对话获取解释。其物理形态(手掌大小、柔软触感)增强社会临场感,使知识传递更亲和。研究计划在学术展会实地测试系统效果,评估其对理解深度与互动体验的影响。未来愿景包括构建“对话式调查”和“集体记忆网络”,推动具身代理从情感陪伴转向智性中介。原创 2025-12-13 20:52:29 · 1054 阅读 · 0 评论 -
混合模型的自学习及其五个核心问题
混合模型的自学习是机器学习领域中一个重要且复杂的研究方向,它结合了多种学习范式和模型架构的优势。让我为您详细阐述这个主题。原创 2025-12-09 14:27:56 · 1103 阅读 · 0 评论 -
《机器学习》西瓜书习题解答 -1.5
NFL定理是一个"守恒定律",说明算法性能在所有问题上的平均是相同的这个定理的前提是所有问题等概率出现,包括完全随机的问题理解定理要关注其前提条件分析理论与实践的差距是关键数学推广要保持公式的结构和逻辑一致性❌ 误解:NFL定理说明算法研究无意义✅ 正解:NFL定理强调算法的有效性依赖于问题特性❌ 误解:存在万能算法✅ 正解:算法需要与问题匹配,没有银弹如何识别问题的特性?如何设计与问题匹配的归纳偏好?在实际应用中如何平衡算法的专用性和通用性?原创 2025-12-09 01:41:41 · 869 阅读 · 0 评论 -
《机器学习》西瓜书习题解答 - 1.4. 归纳偏好
决策树:偏好较短的树和信息增益大的划分朴素贝叶斯:假设特征条件独立支持向量机:偏好最大间隔超平面k近邻:假设相似样本具有相似输出线性回归:假设线性关系神经网络:偏好平滑函数和层次化表示归纳偏好是机器学习算法的内在特征,决定了算法在多个假设中的选择倾向识别算法归纳偏好:看算法优化什么目标、做了什么假设设计归纳偏好:平衡拟合与复杂度,使用正则化思想不要认为完美拟合训练数据就是好模型噪声环境下,适度的"不一致"反而是好事不同的归纳偏好适用于不同的问题领域。原创 2025-12-09 01:39:29 · 663 阅读 · 0 评论 -
《机器学习》西瓜书习题1.3详细解答 - 假设空间与版本空
摘要:本文详细解答了《西瓜书》第1章第3题关于假设空间与版本空间的计算问题。首先统计了橘子数据集的5个属性及其取值,计算出假设空间大小为406(405种属性组合+1个空假设)。然后通过分析训练样本的正反例特征,确定版本空间的核心假设必须包含"大小=大"和"果蒂=扁平"两个约束,并列举了多个满足条件的假设组合。解答过程清晰展示了从假设空间到版本空间的推理思路,体现了机器学习中通过数据缩小搜索空间的基本原理。原创 2025-12-09 01:38:40 · 783 阅读 · 0 评论 -
《机器学习》西瓜书习题解答 - 假设空间习题1.2
本文基于西瓜数据集(2个样本)探讨了机器学习中的假设空间概念: 假设空间计算: 考虑色泽(2值)、根蒂(2值)两个属性 每个属性可取值、通配符(*)或空集(∅) 计算公式为(2+1)×(2+1)+1=10种可能假设 版本空间构建: 筛选与训练数据一致的3个假设: (青绿,蜷缩)、(青绿,)、(,蜷缩) 展示了不同泛化程度的假设 关键启示: 即使简单数据集也会产生多个有效假设 凸显了归纳偏好的重要性 为理解更复杂的机器学习理论奠定基础 通过这个简单案例,清晰展示了假设空间和版本空间的核心概念及其计算方法。原创 2025-12-09 00:16:48 · 951 阅读 · 0 评论
分享