快乐小码农-CSDN博客

原创刚刚，马斯克解散xAI，22万张GPU全给Claude

同时，SpaceX与Anthropic联合宣布，将旗下搭载22万块GPU的超算Colossus 1的全部算力独家租给Anthropic（Claude）。有了这22万张显卡的加持，Claude不仅留住了现有的高端用户，还顺手挖了不少OpenAI的墙角。早在2026年2月，SpaceX 已以‌1.25万亿美元‌的合并估值（SpaceX估值1万亿，xAI估值2500亿）完成了对xAI的全资收购，此次解散仅是去掉其“独立公司”的壳，正式进行品牌整合。目前，SpaceX和Claude的整合正在加速进行。

2026-05-07 19:49:38 321

原创 2025年的图灵奖重磅揭晓！量子信息双杰加冕！

2025年图灵奖授予量子信息科学先驱Charles H. Bennett和Gilles Brassard，表彰他们在量子通信与计算领域的奠基性贡献。这是图灵奖首次颁给量子物理相关研究，恰逢联合国宣布2025年为"国际量子科学与技术年"。两位获奖者被视为量子信息科学的创始人，其理论突破为当今量子系统构建奠定了基础。图灵奖被誉为"计算机界诺贝尔奖"，奖金100万美元由谷歌赞助。这一奖项的颁发标志着量子信息科学在计算机领域的重要地位获得认可。

2026-03-19 15:25:26 74

原创中国教育界的OpenClaw来了！清华团队开源「龙虾」老师——OpenMAIC！

清华大学开源全球首个多智能体AI教学框架OpenMAIC，实现一键生成沉浸式课程。该平台支持上传文档或输入主题自动生成包含PPT、测验等完整课程内容，并配备AI教师和同学进行互动教学。OpenMAIC特别强调个性化学习体验，可应用于从专业课程到儿童科普等多种场景，支持多语言和语音交互。其核心目标是解决在线教育的三大痛点：因材施教、互动陪伴和教师减负。项目开源后迅速引发广泛关注，用户可通过简单操作直接体验AI课堂教学功能。

2026-03-18 14:01:54 3904

原创 AI日报：阿里千问最强模型来了；Kimi开源K2.5；DeepSeek开源OCR2；Clawdbot迫于压力更名Moltbot

近期国内AI领域迎来多项重要突破：阿里推出万亿参数推理模型Qwen3-Max-Thinking，性能媲美国际顶尖大模型；DeepSeek开源OCR 2，首创"因果流"视觉推理技术，文本识别准确率提升3.73%；月之暗面开源多模态模型Kimi K2.5，支持视觉输入和Agent集群协作；腾讯混元图像3.0开源，跻身全球最强开源图生图模型。同时，OpenAI发布科研协作平台Prism，Mistral AI推出终端编程助手Vibe 2.0，AI技术竞争持续升温。

2026-01-30 11:09:51 996

原创 ICLR 2026录用结果公布，28%接收率，深陷AI审稿争议

1.第三方机构对 ICLR 2026 的审稿意见进行系统性统计，其中发现了大量 AI 审稿的现象（有 21% 完全由 AI 生成），还呈现出一些趋势：AI 审稿意见篇幅更长、AI 审稿更可能给出高分。网友们纷纷晒出成绩单，有的研究者不止一篇被录取，比如北大张铭教授组顶会 ICLR 中了 5 篇，还有实验室一口气拿下 8 篇论文，MIT教授、清华校友韩松投中至少9篇。ICLR 似乎没有提出合适的机制，确保AI评审的质量，只是要「评审人对评审内容负有最终责任」、遵守学术伦理。

2026-01-30 11:00:22 1499

原创 Clawdbot爆火，连带Mac mini成当下最热“理财产品”

整个周末，一个叫做 Clawdbot 的AI智能体突然爆火。被它顺带带火的，还有 Mac mini。

2026-01-27 15:26:02 706

原创 OpenAI双王炸：图像思考+成本暴降，AI革命再升级！

从“能说会道”到“自己动手”，AI正渗透科研、医疗、教育等核心领域。模型摒弃传统 16 位数值，采用定制 BitLinear 层，将权重限制为-1、0、+1 三种状态，形成三值系统，每权重仅需约 1.58 位信息存储。：用户上传手绘草图、医学影像等图片，模型能直接“用图像推理”，例如解析学术海报数据、分析病理切片并提出诊疗建议，准确率超人类专家水平。图：新模型系列更新，一共带来三个版本：GPT-4.1（中杯），GPT-4.1 mini（小杯）、GPT-4.1 nano（超小杯）。该模型在MIT许可下公开，

2025-04-21 10:53:32 763

原创开源神器DeepSite携手DeepSeek-V3，「氛围编程」火爆了

以 Karpathy 的 iOS 应用开发为例，他的工作流程相当简单：明确需求，寻求 AI 帮助，跟随 AI 提供的设置和代码实现功能，然后不断迭代改进。虽然“氛围编程”强调“忘记代码的存在”，但在实践中，至少也需要基本了解不同的代码究竟在做什么，尤其是在调试阶段。值得一提，DeepSite 完全开源，使用了最新版本的 DeepSeek-V3-0324，直接开箱即用，让你一次性创建应用程序和游戏。随着大型语言模型能力的飞速提升，开发者可以不再专注于代码本身，而是关注想要实现的功能和效果。

2025-04-10 10:52:34 1162

原创 Llama 4 被曝刷榜作弊，差评如潮...

没想到，Meta Llama 4 发布 36 小时后差评如潮：代码测试小球穿墙失效；第三方榜单成绩垫底；匿名员工爆料内部数据泄露隐患；高层离职与恐慌模式频现；合成数据争议未消；写作文本重复僵化；网友调侃“DeepSeek-R1出世两月，Meta却像熬了几辈子”...

2025-04-10 10:45:15 1218

原创斯坦福2025 AI Index报告发布！

在工业机器人领域，中国继续保持主导地位，2023 年安装量达 27.63 万台，是日本的 6 倍，美国的 7.3 倍，占全球份额的 51.1%。在短时间范围内（两小时预算），顶级 AI 系统的得分是人类专家的四倍，但随着时间预算的增加，人类表现优于 AI——在 32 小时内领先 AI 两倍。今年的这份报告是迄今为止最为全面的一版，新增了对 AI 硬件演进、推理成本估算、AI 出版和专利趋势的深入分析，并扩大了关于企业采用负责任 AI 实践以及 AI 在科学和医学领域角色的新鲜数据。

2025-04-10 10:37:36 2253

原创氛围编程(Vibe Coding)火爆了，AI 会取代程序员吗？

原创 DeepSeek开源周Day4三连发，梁文峰亲自上阵，API 错峰优惠

DeepSeek 使用两个 micro-batch 来重叠计算和全对全（all-to-all）通信，同时确保注意力机制的计算负载在两个 micro-batch 间保持平衡 —— 这意味着同一个提示可以在它们之间拆分。，该配置文件采用 EP32 和 TP1（与 DeepSeek V3/R1 的实际在线部署一致），提示长度设置为 4K，每 GPU 的批大小为 16K 个 token。需要注意的是，专家负载的具体预测方法不在此代码库的讨论范围内，一种常用的方法是使用历史统计数据的移动平均值。

2025-03-04 10:35:38 1211

原创 CVPR 2025 录用结果公布！严禁AI评审！大模型参评审稿人的19篇论文被桌拒

CVPR 领域主席（Area Chair/AC）曝出：一些极不负责审稿人，要么彻底放弃了评审过程，要么提交了质量极低的审稿结果，其中一些结果还是由大型语言模型（LLM）生成的。最终，CVPR 官方公布了对此事件的处理结果：项目主席（PC）决定拒收这些审稿人撰写的 19 篇论文，实施「根据 CVPR 2025 此前公布的政策，确认了这些高度不负责的评审员，并追溯到他们作为作者提交的论文。此外，更惊爆的是，CVPR 组委对一些不负责任的审稿人进行了惩罚。），今年的大会录取率创下了历史新低。

2025-03-04 10:31:32 3053

原创【最新开源】美研究机构发布全球最大生物学AI模型Evo 2！阶跃星辰首次开源Step系列多模态大模型!

2月19日，美国 Arc Institute 与英伟达合作，联合斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员，共同推出了——。该模型以超过 128，000 个基因组的数据为基础，训练了 9.3 万亿个核苷酸，使其规模与最强大的生成性 AI 语言模型相媲美。是一种先进的 DNA 语言模型，专注于长上下文的建模和设计。它能够在单核苷酸分辨率下对 DNA 序列进行建模，支持长达 100 万碱基对的上下文长度。

2025-02-25 15:48:56 1194

原创机器人前瞻：1X发布全新人形机器人！还有史上最惊悚的机器人！

是 Figure 首个人形视觉-语言-动作（VLA）模型，它统一了感知、语言理解和学习控制，可以克服机器人技术中的多个长期挑战。Clone Robotics 是一家成立于 2021 年的波兰创业公司 —— 专注于仿生机器人技术，致力于实现类似生命体的运动、力量和灵巧度。公司成立后推出的首个产品名叫「Clone Hand」，这是一款配备人工肌肉和骨骼的机械臂，其行为模式与人手相似。是首个同时操控两台机器人的VLA，使他它们能够解决共同的、长序列操作任务，即使是处理从未见过的物品。

2025-02-25 15:46:10 1190

原创阿里国际开源Ovis2多模态新王炸！DeepSeek开源首个代码库FlashMLA！

系列包括 1B、2B、4B、8B、16B 和 34B 六种不同参数规模的模型版本，以满足多样化需求。它不仅强化了小规模模型的能力密度，还通过指令微调和偏好学习大幅提升了思维链（CoT）推理能力，使其在数学推理和视频理解任务中表现尤为突出。Hopper 是英伟达的GPU（图形处理芯片）架构，例如H100和H800，发布于2022年，主要用于AI计算。引入了视频和多图像处理能力，并增强了多语言能力和复杂场景下的OCR能力，显著提升了模型的实用性。冻结 LLM，训练视觉模块，学习视觉特征到嵌入的转化。

2025-02-25 15:44:10 858

原创马斯克发布「地表最强」Grok-3，屠榜多个排行榜，暴击DeepSeek-R1

参考：https://techcrunch.com/2025/02/17/elon-musks-ai-company-xai-releases-its-latest-flagship-ai-grok-3/在数学（AIME 2024）、科学问答（GPQA）、编码（LCB）上刷新SOTA，大幅超过 Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet 和 GPT-4o。在多项基准测试中，在数学（AIME’24）、科学（GPQA）和编码（LCB Oct-Feb）上，

2025-02-20 19:49:49 1687

原创 UC 伯克利等开源OpenThinker-32B，性能直逼 DeepSeek-R1-32B！

最近一段时间，以 DeepSeek-R1 为代表的大型推理模型可谓是「当红炸子鸡」！

2025-02-17 18:11:56 1236

原创 AI最新资讯：DeepSeek 估值飙升至 1500 亿美元？国行iPhone最终选择阿里千问？

目前，它打开的是视频推送，但未来也可能会提供图片生成的相关内容。除了图像生成功能的改进，OpenAI 还对 Sora 的视频推送进行了改版，将其分为「Best」和「Top」两个类别，将帮助用户更好地筛选和查找内容。此外，业内人士也指出，ChatGPT 尚未推出基于 GPT-4o 的多模态图像生成功能，因此此次 Sora 项目的推出将是一个值得关注的新进展。近日，OpenAI 被爆出一个消息：在其内部测试的项目 Sora 中，除了已经推出的视频生成功能外，图像生成功能也在紧锣密鼓地研发中。

2025-02-14 15:20:23 1171

原创 DeepSeek 开源新一代文生图模型 Janus-Pro！

1月28日，DeepSeek 开源了一个文生图模型，旨在实现高质量的文本-图像生成与多模态理解。是一种新颖的自回归框架，统一了多模态理解和生成。通过将视觉编码解耦为独立路径，同时利用单一的统一 Transformer 架构进行处理，解决了以往方法的局限性。解耦不仅缓解了视觉编码器在理解和生成中的角色冲突，还增强了框架的灵活性。

2025-02-14 15:11:26 1024

原创宇树科技+英伟达！ASAP让宇树G1人形机器人变“真人”

基于 HumanoidVerse 框架，支持在多个模拟器中训练人形机器人技能，并实现模拟器与现实世界之间的平滑迁移。(Aligning Simulation and Real Physics，对齐模拟与真实物理) 的创新框架，并将其应用于宇树科技G1人形机器人。在真实机器人上的测试中，ASAP也能够显著提高机器人的运动性能，使机器人能够完成高难度的敏捷动作。在模拟器之间的迁移中，ASAP能够显著降低运动跟踪误差，优于其他基准方法。，这是一个两阶段框架，旨在解决动力学失配问题，并实现敏捷的人形全身技能。

2025-02-14 15:07:42 1878

原创谷歌反击DeepSeek R1发布Gemini 2.0全家桶，几大云巨头官宣接入DeepSeek

2月2日，云轴科技 ZStack 宣布 AI Infra 平台 ZStack 智塔全面支持企业私有化部署 DeepSeek-V3/R1/ Janus Pro三种模型，并可基于海光、昇腾、英伟达、英特尔等多种国内外CPU/GPU适配，将充分发挥DeepSeek开源模型和低成本高性能特点，助力企业级AI应用进一步落地。2 月 4 日，华为计算宣布，潞晨科技携手昇腾，联合发布基于昇腾算力的 DeepSeek R1 系列推理 API，及云镜像服务。

2025-02-14 15:02:30 905

原创最新开源： Hugging Face最小AI视觉语言模型登场！百川智能开源Baichuan-M1医疗增强大模型！

基于 GenAI 技术构建，而依赖于逻辑链条（Chain-of-Thought，CoT）来逐步推导出解决方案，这是一种用技术换时间和算力资源的方案，使思考模型可以用 10 分钟做完一套高考数学卷，分数超过 120 分，在逻辑推理能力上，进一步靠近人类专家。两款模型均采用 Hugging Face 的先进多模态技术，能够执行图像描述、短视频分析、文档理解等任务，尤其适合内存少于 1GB 的设备如笔记本电脑，为开发者提供更广泛的应用场景。让生成的「白模」（没上色的模型）效果“堪比设计师手工建模”。

2025-02-14 11:20:06 1719

原创百川智能发布「全场景深度思考模型」，开源Baichuan-M1医疗增强大模型！

在 MMMU-val、MathVista 等权威评测中的成绩也超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等模型，进一步证明了其跨领域的卓越性能。在 AIME、Math 等数学基准测试以及LiveCodeBench代码任务上的表现均优于 o1-preview 等模型，展现了其强大的语言理解和处理能力。，作为 Baichuan-M1-preview 的小尺寸版本，Baichuan-M1-14B 在保持高性能的同时，更加灵活易用。1 月 24 日，百川智能发布了。

2025-02-14 11:14:35 759

原创 DeepSeek-R1 成为首个与OpenAI o1比肩的开源推理模型！

下如图所示，做 2024 年的 AIME 数学奥赛试卷，DeepSeek-R1-Zero 的平均 pass@1 分数从最初的 15.6% 显著提升到了 71.0%，达到了与 OpenAI-o1-0912 相当的水平。结果显示，通过RL，即便没有监督微调数据，DeepSeek-R1-Zero 依然获得了强大的推理能力。在多数投票机制中，DeepSeek-R1-Zero 在 AIME 中的成功率进一步提升到了 86.7%，甚至超过了 OpenAI-o1-0912 的表现。

2025-02-14 11:02:23 637

原创首份《人工智能安全指数报告》发布，Anthropic 获得最高安全评级，中国智谱上榜

2024年12月，未来生命研究所（Future of Life Institute）发布了第一份《人工智能安全指数报告》（FLI AI Safety Index 2024），共80页。该报告由图灵奖得主 Yoshua Bengio、加州大学伯克利分校计算机科学教授 Stuart Russell 等7位全球顶尖AI专家组成的独立评审小组，评估6家主流 AI 公司（Anthropic、Google DeepMind、Meta 、OpenAI、x.AI、智谱）在六大领域的安全实践，包括。

2025-02-14 11:00:28 1683

原创 2024 年最具影响力的AI论文 Part 1

简而言之，对于每条过滤规则，研究团队都会从原始数据和过滤后的数据中抽取了 3600 亿token 的随机样本，然后训练了一个 17.1 亿个参数的小型 Llama 类模型。在“稀疏混合专家”（Sparse Mixture of Experts）模型中，“稀疏”（Sparse）指的是在任意时刻，只有专家层的子集（在 Mixtral 8x7B 中通常是 8 个中的 1 到 2 个）被激活，用于处理一个 token。这篇论文的研究表明，LoRA 的学习效果明显低于完整微调，尤其是在编码等需要获取新知识的任务中。

2025-01-16 09:39:21 2171

原创最新开源：VITA-1.5：实时视觉与语音交互，1.5秒互动延迟

的独特之处在于其能够进行高效的语音对话，无需单独的自动语音识别（ASR）和文本到语音（TTS）模块，这对于加速端到端多模态系统的响应时间具有颠覆性意义。，包括视觉对齐、视觉理解和视觉有监督微调，旨在弥合视觉和语言之间的差距，并使模型能够理解图像内容和回答视觉问题。，是一个开源的集成了视觉、语言和语音的多模态大语言模型，旨在实现类似 GPT-4o 水平的实时视觉和语音交互。，包括编解码器训练和 NAR + AR 解码器训练，旨在使模型能够生成语音输出，实现端到端的语音交互。输出端则具有一个端到端的。

2025-01-16 09:30:00 936

原创最新开源：英伟达推出 Cosmos 世界基础模型平台，支持物理 AI 系统开发

是一个世界模型平台，专为物理AI而设计，上面有一系列开源、开放权重的视频世界模型，参数量从 4B 到 14B 不等。这些模型的作用非常明确，就是为机器人、自动驾驶汽车等在物理世界中运行的 AI 系统生成大量照片级真实、基于物理的合成数据，以解决该领域数据严重不足的问题。平台发布了 8 个模型，参数量从 4B 到 14B 不等，这些模型在 2000 万小时的视频数据上进行训练，分为。一共包含了四大功能模块：扩散模型、自回归模型、视频分词器，以及视频处理与编辑流程。（离散 token）模型两类，支持。

2025-01-16 09:27:10 843

原创 Aria-UI：面向GUI智能交互的多模态模型，超越Claude 3.5

通过开创性的「纯视觉理解」方案彻底改变了这一现状，无需任何后台数据支持，仅通过直接观察用户界面就能完成自然语言理解、界面元素定位、语义对齐和任务执行等全流程操作。是一个轻量级且快速的混合专家(MoE)模型，每个token激活 3.9B 参数，支持超高分辨率，能够高效编码不同大小和纵横比的 GUI 输入。，一款采用纯视觉理解的多模态模型（LMM），凭借其令人瞩目的性能表现，迅速成为AI技术圈中的焦点，甚至超越了Claude 3.5。，我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。

2025-01-16 09:24:40 724

原创最新开源：Dispider 实现视频LLMs的主动实时交互！又一个媲美 o1 的“开源推理模型”来了！

NovaSky 团队利用阿里巴巴的 QwQ-32B-Preview 模型，生成了Sky-T1-32B-Preview 的初始训练数据，随后“整理”数据混合，并利用 OpenAI 的 GPT-4o-mini 将数据重构为更易用的格式，最终形成了可用的训练集。Sana 不仅在速度上取得了突破，在图像质量方面也具有竞争力，即使是复杂的场景，如文字渲染和物体细节，Sana 的表现也令人满意。不仅在常规视频 QA 任务中保持了强大的性能，而且在流式场景响应方面也明显超越了以前的在线模型，从而验证了架构的有效性。

2025-01-16 09:20:40 1418

原创最新端侧AI ：阿联酋TII发布Falcon3！AI Safeguard联合CMU开发Ivy-VL！微软发布超强小模型Phi-4

超越了顶尖的端侧 SOTA 模型，包括 Qwen2-VL-2B，InternVL2-2B，InternVL2.5-2B，SmolVLM-Instruct, Aquila-VL-2B 以及 PaliGemma 3B 等模型。与传统的大型语言模型（LLM）相比，SLM 模型因其较少的参数和更简洁的设计，具备高效性和低成本优势，尤其适合在客户服务、医疗保健、物联网等领域中应用。，拥有仅 3B 的参数，与7B以几十B的多模态模型相比，具有更小的硬件占用。，延续之前的小参数模式只有 140 亿。

2025-01-06 10:36:12 1027

原创最新大模型：香港多所高校推出多模态大模型Lyra！IBM发布Granite3.1模型！

这是一组轻量级、先进的开源基础模型，支持多语言、代码生成、推理和工具使用，能够在有限的计算资源上运行。提供12 种不同语言的多语言支持：英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语和中文。的极小尺寸和快速生成能力使其非常适合在移动设备上应用，可以用于各种需要高分辨率图像生成的场景，如图像编辑、视频创建等。在各种视觉-语言、视觉-语音和语音-语言基准测试中取得了 SOTA 的性能，同时还使用了更少的计算资源和训练数据。

2025-01-06 10:31:17 1204

原创智源发布 FlagEval 全球100+大模型综合评测结果！国产大模型拿下多个冠军！

今年上半年参评的模型普遍无法生成正确的中文文字，但此次参评的头部模型已经具备中文文字生成能力，但整体普遍存在复杂场景人物变形的情况，针对常识或知识性推理任务，小于3的数量关系任务表现有所提升，大于3的数量关系依然无法处理，涉及中国文化和古诗词理解的场景对于模型而言是不小的挑战。，得益于文本大模型的进步，能力提升巨大，覆盖面更全，但在具体任务上与专家模型还存在一定差距，整体而言，性能好、通用能力强的开源语音语言模型偏少。大模型更擅长反驳，各个模型表现突出的辩论维度趋同，在不同的辩题中，模型表现差距显著。

2025-01-06 10:26:46 1402

原创最新开源：国产大模型DeepSeek-V3来了！阿里云开源首个多模态推理模型QVQ！腾讯推出新型翻译模型 DRT-o1

DeepSeek-V3 的成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型，并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。此外，在剩下的三个专注于数学和科学问题的基准测试中，QVQ-72B-Preview 表现出色，有效缩小了与领先的最先进的 OpenAI o1 模型之间的差距，与 Claude3.5 Sonnet等推理模型相当。DeepSeek-V3 在多种标准基准测试中表现优异，尤其在数学和代码任务上表现突出。

2025-01-06 10:19:27 3745

原创端侧AI | 小模型 | SLM（11月-12月）

在基准测试方面，和其他 SLM 模型(Gemma-2B, Qwen1.5-1.8B, StableLM-2-1.6B 和 OpenELM1.1B)相比，Fox-1 在 ARC Challenge (25-shot)， HellaSwag (10-shot)， TruthfulQA(0-shot)，MMLU (5-shot)，Winogrande (5-shot)，GSM8k (5-shot)) 模型因其较少的参数和更简洁的设计，具备高效性和低成本优势，尤其适合在客户服务、医疗保健、物联网等领域中应用。

2025-01-06 10:15:05 1519

原创最新开源：全球首个半导体专用大模型SemiKong 70B发布！全球首个中文安全领域事实性基准评测集！

涵盖了包括中国违法违规，伦理道德，偏见歧视，辱骂仇恨，身心健康，谣言错误，网络安全理论知识等方面的安全知识。SemiKong 旨在通过将领域特定的知识融入模型中，解决半导体行业面临的独特挑战，如半导体器件和工艺的物理和化学问题，充当该领域的“数字专家”，从而显著加快新芯片的上市速度。SemiKong 系列模型是双语语言模型，训练于 3T 多语言语料库，展示了在语言理解、常识推理、阅读理解等方面的强大能力。中文：使用中文并且聚焦于中国相关的安全知识，特别是中国法律框架、道德标准和文化环境相关的安全问题。

2025-01-06 10:07:54 1432

原创【2024年终总结】2024年AI大模型总结报告 | Artificial Analysis

2024年是大模型发展非常迅速的一年，我们见证了太多AI技术变革带来的惊艳！这一年里，各家大模型的能力提升层出不穷。LLM方面，OpenAI发布了更强的o系列模型；文生图开源模型也出现了 SD 的替代者 Flux；视频生成模型更是百花齐放，很多大模型公司都推出了类 Sora 的视频生成模型。近日，回顾了2024年人工智能的重大事件，梳理出了一份关于人工智能领域的年终总结。Artificial Analysis 是一家领先的独立AI基准测试和分析平台，上面分析的模型不仅包括，还有如文生图、文生视频等等。

2025-01-06 09:48:38 2290

原创【2024年终总结】2024年最值得读的 AI 论文

对于刚刚过去的 2024 年，有哪些论文值得反复阅读？知名机器学习与 AI 研究者 Sebastian Raschka 整理了一份关于LLM 的阅读清单（），清单详细介绍了每个月都有哪些重要论文产出。

2025-01-06 09:44:13 1892

原创【2024年终总结】2024年“大模型 & AI应用”值得推荐的好书

人工智能简史》全面讲述人工智能的发展史，几乎覆盖人工智能学科的所有领域，包括人工智能的起源、自动定理证明、专家系统、神经网络、自然语言处理、遗传算法、深度学习、强化学习、超级智能、哲学问题和未来趋势等，以宏阔的视野和生动的语言，对人工智能进行了全面回顾和深度点评。一是以通俗易懂的方式解释复杂概念，通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法，包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆，以及外部工具等，使读者能够全面了解和掌握这一先进技术的应用和二次开发。

2025-01-06 09:37:59 3367

decision_tree_classifier_viz

空空如也