自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

强化学习曾小健

强化学习、大模型、AIGC、AGI

  • 博客(5613)
  • 资源 (8)
  • 收藏
  • 关注

原创 我叫曾小健,开发第一线:新Windows与开发环境:大模型LLM/量化 Win-Mac统一快捷键体验 win强制关机:shutdown /s /f /t 0

对于开发者用Windows来说,最大的建议就是不要用Windows,既然必须要用,那就来吧!!!

2023-07-24 10:45:24 657 1

原创 Ubuntu Linux AI大模型开发常用命令 - 更新中 包括NVIDIA状态,和安装相关常用软件包,没事就背背 - 背诵创造美好生活

Ubuntu AI大模型开发常用命令 - 更新中 包括NVIDIA状态,NVIDIA状态,实时更新:和安装相关常用软件包没事就背背,增加开发效率。

2023-06-21 11:28:05 863 1

原创 RLVR post-train和 RFT在本质上很接近,最主要差异是规模不同 这句话是什么意思

RFT 本质是:模型输出 →人类/模型打分→ 用奖励优化模型RLHF(人类反馈)DPO(偏好学习)PPO(策略梯度)特征RFT奖励来源人 / 偏好数据成本高数据规模小~中泛化受限奖励是“可程序验证的”,不需要人类打分代码是否通过测试 ✔数学题答案是否正确 ✔SQL 是否执行正确 ✔模型输出 →自动验证器 → reward(0/1)特征RLVR奖励来源自动验证成本低数据规模极大可扩展性强。

2026-03-27 09:04:31 272

原创 林俊旸原文的中文翻译

核心智能将越来越多地来自多个智能体的组织方式:一个负责规划和分配工作的编排者,充当领域专家的专业智能体,以及执行更窄任务的子智能体——同时帮助控制上下文、避免污染,并维持不同推理层次之间的分离。我认为它最终可能会取代大部分旧的静态独白式推理思考:那些过度冗长的、孤立的内部推理轨迹,试图通过输出越来越多的文字来弥补缺乏交互的不足。在智能体时代,优势将来自更好的环境、更紧密的训练-服务集成、更强的套件工程(harness engineering),以及在模型的决策与这些决策产生的后果之间闭合回路的能力。

2026-03-27 09:02:51 191

原创 上手体验价值5万的MacBook Pro后,我动起了下单的念头。

总之,这俩产品确实贵得离谱,但如果万一是那种,在乎隐私需要在咖啡馆里跑本地模型的大拿,又或者是在剧组现场直接调 8K ProRes Raw HDR 素材的 Pro 哥,那苹果提供的不是一台电脑,而是 “目前地球上几乎唯一的移动生产力闭环”。额这个可能是我的问题,以及仅限于苹果设备的显示支持--换个 Windows 或者安卓,这 HDR 就不给了。不过,对于咱们这些普通消费者来说,16+512G,32+1T 的组合完全就够用了,毕竟质感做工这块,无论是啥配置的 MBA 还是 MBP,都是没有缩水的。

2026-03-22 21:09:09 340

原创 去Polymarket上与人类赌博的OpenClaw,已经月入数万美元了|亮马桥小纪严选

去年10月,泽连斯基访问白宫并提出“无人机换战斧导弹”的交易提案,Grok-3进行了“基于信念的推理(belief-basedreasoning)”,将内部预估的停火概率从0.15动态上调到了0.22,同时它注意到,当时“YES”合约的价格大幅跳升至0.18。这形成交叉验证,于是,Grok-3判定该合约存在被低估的套利空间,确立了坚定做多并持有的策略。BTC、ETH等5分钟和15分钟短期预测市场的波动剧烈,特别是在交易所发生强制平仓潮等极端行情时,极易产生价格错位,这给机器人的高频介入提供了完美的温床。

2026-03-21 20:47:26 406

原创 vla 数据具体怎么采集的

先别贪大,选 10–20 个高频家务子任务:pick/placewipe tableVLA 数据采集,本质是“让人或专家先做一遍”,再把观测、语言、动作、结果按时间严格对齐,清洗标准化后变成机器人可学习的轨迹数据。“家务机器人 VLA 数据表字段设计”,或者“从遥操作到 LeRobot/OpenVLA 训练格式的完整 JSON/Parquet 结构示例”。

2026-03-21 13:49:52 308

原创 mujoco 和 issacgym 仿真环境异同和优缺点

mujoco 和 issacgym 仿真环境异同和优缺点我先按“架构、物理引擎、并行训练、传感器/视觉、机器人生态、上手成本”几个维度对比,再给你一个面试版结论和项目选型建议。先给你一个最新关键信息:Isaac Gym 现在更准确应视为这一点如果你拿去面试说,会比只讲 “MuJoCo vs Isaac Gym” 更准确。已思考 28s如果你今天是在2026 年做新项目,更准确的比较应当是:MuJoCo vs Isaac 系列(。因为,NVIDIA 官方 RL/学习工作流已经迁移到,其底座是。

2026-03-20 16:49:25 328

原创 claude code2.1.79以后 有允许就系统通知/hooks

【代码】claude code2.1.79以后 有允许就系统通知/hooks。

2026-03-20 01:00:58 199

原创 微信接入龙虾了!5分钟配好,直接发微信聊

活是你电脑上的龙虾在干,微信只是遥控器。稍等几秒钟,就完成配置啦。这一步是绑定和和 OpenClaw 聊天的微信账号,出现你的头像和昵称就说明绑定成功。什么都不用折腾,想用最懒的方式使唤龙虾的朋友,直接看这篇,5 分钟教你配好。回到 WorkBuddy,在主界面点击右上角头像,进入「Claw 设置」。到这里所有配置就完成了,你可以在微信里和 OpenClaw 聊天了。此时,在集成列表中找到「微信客服号集成」,点击右侧的「配置」按钮。在电脑不关闭的情况下,WorkBuddy 就可以随时随地为你工作。

2026-03-18 18:46:26 434

原创 qs ranking2026

2026-03-16 23:16:56 54

原创 扎克伯格150亿美金抢来的天才Alexandr Wang传要离职了…AI时代人才太贵了

真正让扎克伯格动摇的,是硬实力的缺失。作为Wang入职后的“一号工程”,Llama 4被寄予厚望。然而,今年1月的内部测试结果却令人大跌眼镜:Llama 4在逻辑推理和数学能力上不仅没有反超OpenAI,甚至在某些维度上表现得极其不稳定。更致命的是,有审计指出,Wang的团队为了追求漂亮的基准测试(Benchmark)分数,疑似在训练集中加入了针对考试题库的“特化数据”。这种“应试教育”式的AI训练,彻底激怒了追求技术纯粹性的扎克伯格。

2026-03-14 18:09:45 66

原创 AWE2026,机器人不再遥不可及

在 AWE2026 上,追觅不仅展示了大量机器人产品,还首次以独立展位推出了汽车品牌「星空计划」,展出了 SUV 概念车、超跑以及造型极具科幻感的「火箭车」,并首次公开手机全系产品。,就接入了 JoyAI 语音大模型,可以实现较为自然的语音互动;无论是工业场景的实干、服务场景的导览还是家庭场景的陪伴,这些机器人正在一步步减少人机之间的距离,朝着融入人类日常生活的趋势发展。在日常应用中,「八界」不仅能自主识别并收纳散落的杂物,还能根据家庭成员的生活习惯,完成空间的分区整理与物品的精准归位。

2026-03-14 18:01:40 47

原创 Palantir “本体论”:是跨时代的AI架构,还是精心包装的“建表”骗局?

本体能够明确地定义概念的层级结构(如“员工”是“人”的一种)、属性的类型和约束(如“年龄”必须是正整数)、以及关系的具体含义和特性(如“工作于”是“员工”和“公司”之间的关系,且具有方向性、传递性等)。随着业务的扩展和需求的增加,逐步演进和扩展本体模型。语义查询与推理 :业务人员可以直接通过本体的语义模型进行查询,例如:“查询所有由特定供应商 X 提供的、用于生产 Product A 的原材料批次,以及这些批次当前所在的仓库位置,其最近的质量检测结果是否合格,以及对应的使用说明文档。

2026-03-14 17:58:49 312

原创 揭秘追觅的技术策略:研发一代、储备一代、布局一代

汽车展台上的平台架构负责人告诉我,他们不只做车机联动,而要真正打通车、家、机器人全场景,让用户真正拥有智能生活的体验,并且他们已经在规划下一代汽车产品了。“量产一代、研发一代、储备一代”,这套看似朴实无华的方法论,才是追觅敢于同时落子手机、汽车、芯片、太空的底气所在。这套打法,业内俗称“吃着碗里的,看着锅里的,还得惦记着地里的”,与顶级投资机构的资产配置逻辑并无二致。在AWE 2026的现场,看着那个集齐了扫地机、手机、汽车、芯片、太空站模型的庞大展台,有人感叹追觅的野心,也有人质疑追觅的边界。

2026-03-14 17:56:48 159

原创 火到OpenClaw创始人跟前了!百度“养虾全家桶”到底有多猛?

养虾”在短短几个月内迅速成为AI行业的新热点,反映了AI Agent正在经历从开发者工具向大众应用的转变。在这个阶段,真正的竞争不再只是模型能力本身,而是谁能让AI助手更容易获得、更低成本运行,并在更多场景中发挥价值。通过DuClaw、轻量云服务器、百度App入口和Operator移动端应用,百度试图搭建起一条从部署到使用、从PC到手机、从开发者到普通用户的完整路径,把原本只属于技术玩家的“养虾”体验推向更广泛的用户群体。

2026-03-14 17:54:06 145

原创 如果梁文锋、王兴兴、汪滔读博,还会有Deepseek、宇树、大疆?王树国三问,戳破AI圈学历崇拜的遮羞布

大疆、宇树科技、Deepseek的爆红与成功,从不是偶然,而是三位创始人舍弃学历光环、坚守实战创新的必然结果。学历是入行的敲门砖,却绝非人生的天花板;实战能力是科创的硬通货,才是立足科技圈的真正底气。别让学历崇拜困住前行的脚步,别让文凭枷锁磨灭科创的热爱。AI时代,躬身实干者方能破局而立,坚守创新者终能铸就辉煌。放下学历执念,奔赴实战战场,中国硬核科技的未来,藏在每一位实干者的脚步里。

2026-03-14 01:38:17 348

原创 魔搭推出Twinkle: 训练即服务, 让模型训练回归算法语义

Twinkle项目可以以组件化方式承载单卡、多卡、Ray等模式,帮助算法开发者尽量减少训练、采样的复杂开发和维护的成本,并给大模型行业提供一种新的商业模式。然而我们对这个框架的希望还不止于此。比如,我们可以将评测过程API化,这样整个的训采评过程都可以细粒度切分随意组合,这带来了非常大的想象空间,例如模型的持续进化。此外,在较新的工作中,API化的训练过程可以融合进Agent框架中,实现大模型的自进化(我们希望Twinkle。

2026-03-14 01:33:09 422

原创 新型「验证码」诞生?这张图让 ChatGPT、Claude、Gemini 都翻了车

这种现象源于人类视觉系统中的侧抑制机制,即视网膜中一个神经元的活动会抑制其邻近神经元的活动,从而增强对比度,有时会在边缘或交叉点产生虚幻的感知。他甚至还找了一些熊猫的图片试了下,GPT-5 Pro 在思考了近 4 分钟后答对了。网友 Moll 也表示,一开始 ChatGPT 和 Claude 都只看到了「这只是视觉错觉」,直到她要求这俩模型看完整个图片后,他们才回答出「心形」。还有网友表示,提示词中可以先让 ChatGPT 模糊图像,这就像眯眼,然后再让它认真思考,就能得到正确答案。人眼秒懂,AI抓瞎!

2026-03-14 01:16:15 387

原创 OpenAI首个GPT-5找Bug智能体:全自动读代码找漏洞写修复

正如开头提到的,它不仅能够进行深度分析、定位仅在复杂条件下出现的问题,在对“黄金测试仓库(golden repositories)”的基准测试中,也实现了92%的识别率。微软在10月16号发布了Vuln.AI,正式宣告使用AI进行漏洞管理,而在10月的最后一天,OpenAI也是姗姗来迟,跟上了这次更新的节奏。首次连接仓库时回溯历史提交。同时解释发现的漏洞,在代码中标注,便于人工复审。因此,在漏洞数量激增、攻击手段日益智能化的背景下,借助AI自动化发现与修复漏洞,已成为确保软件安全和降低企业风险的关键手段。

2026-03-14 01:06:01 324

原创 Nvidia如何整合吸收Groq的技术

原创 渣B2026年1月7日 11:19浙江603人。

2026-03-14 01:04:43 394

原创 哥伦比亚大学研发“会笑的机器人” 科创团队惊现咱“嘉”人

关于胡宇航的传说有很多,像宝典一样流传下来的还有那个“单片机奋斗法”——我把每件要做的事情标上优先级,像计算机处理多任务一样,优先处理最高优先级的任务,如果期间遇到更重要的事情(出现中断请求),就优先处理更重要的事情(中断函数)。他们认为,面部表情在建立信任方面发挥着巨大作用,随着机器人已经被越来越多地用于疗养院、医院等与人类紧密合作的地方,相比“冷冰冰”,我们更需要灵敏、有“温度”的机器人。”在赴美留学前,胡宇航曾如此回首他的“嘉园”生活,他说,在“嘉”四年,他最大的收获是成长,“遇到了更好的自己”。

2026-03-14 00:39:29 221

原创 高中辍学,没学历、没经验!OpenAI 研究科学家:我靠 ChatGPT 自学成才 O-1 杰出人才签证Gabriel Peterson

CSDN程序人生 2026年2月25日 15:04 63人高中辍学,靠刷论坛拿下美国杰出人才签证,更是靠 ChatGPT 自学成了如今的 OpenAI 的研究科学家。“我表哥以前总说我回答 Stack Overflow 上的问题是在浪费时间,但后来,正是那些拥有数百万浏览量和同行评审的帖子,帮我满足了 O-1 杰出人才签证的‘学术出版物’标准。”他就是 Gabriel Peterson,OpenAI Sora 团队的一员,一位没有博士学位,甚至没有高中文凭的 AI 研究科学家。Gabriel Peters

2026-03-12 06:47:20 647

原创 托尼·霍尔逝世:从文科生到图灵奖得主,他发明了让无数程序员头疼的null

2018 年他缴纳了一张 35 美元的普通罚单,系统由此将他的信息与"NULL"字段绑定,此后,全州所有忘记填写车牌号的空白罚单,都自动寄到了他名下。他对 null 的那次道歉,在计算机科学界至今仍是一段佳话,不仅因为内容本身,更因为一位图灵奖得主愿意就此公开站出来说“我错了,我很抱歉”。如果你写过代码,那么一定遇到过它:一个让程序突然崩溃、屏幕上跳出红色报错的元凶——“NullPointerException”,也就是我们常说的“null”,代表“无效的,缺失的,无意义的,空值”。

2026-03-12 06:16:12 196

原创 10.3 亿美元!杨立昆融了欧洲最大一笔种子轮,他要把产品卖回 Meta

LLM 的训练数据是文本——大量文本。它学会了语言模式,学会了「哪个词经常跟哪个词连在一起」,但它从未真正理解过「苹果落下来是因为重力」「这条路堵死了就得绕行」这类物理因果逻辑。圈子里有人认同他,更多人觉得他固执——毕竟 OpenAI、Anthropic、Google 都在 LLM 上狂奔,估值一路飙,哪里看起来像是死路?一个粗糙但有用的类比:LLM 是读了海量书本之后学会说话的 AI,世界模型是在真实世界里跌打滚爬之后学会行动的 AI。押注他的人,同时也是这场他要「颠覆」的 AI 浪潮的最大受益者。

2026-03-11 09:52:06 345

原创 杰瑞米·霍华德最新对话:Vibe Coding 就像在拉老虎机,AI 正在剥夺人类获得“直觉”的权利

当你这么做的时候,你通常只需要微调最后的一两层。我们正在亲眼目睹一个巨大的权力倒退:科技巨头利用这种恐惧作为武器,试图建立起极高的监管护城河,让开源社区死亡,让初创公司无法生存,从而把人类文明下一个十年的知识基础设施,牢牢锁在他们的私有服务器里。我们在放射学领域发现,如果我们可以自动识别肺部 CT 扫描中所有的“候选结节(Possible Nodules)”,而且我们做得确实比人类好,那么放射科医生就可以省去满屏幕找黑点的机械劳动,把全部精力集中在判断:“这些标记出来的结节,到底是良性的还是恶性的?

2026-03-10 00:24:57 368

原创 Anthropic硬核调研:谁在真正被AI“夺走”工作?

这份报告结合了理论推演和平台的真实跑批数据,提供了一个看待“AI 抢饭碗”的新视角。目前来看,

2026-03-10 00:20:06 444

原创 大数据的“4V”特征是指Volume(规模)、Velocity(速度)、Variety(多样性)和Veracity(真实性)。

20.属性可以分为 nominal(定类), ordinal(定序), interval(定距) 和 ratio(定比)等不同的类型,区分它们对于选择正确的数据分析方法至关重要。12.在计算两个用户的兴趣相似度时,如果用户A的评分向量是[5, 5, 5],用户B的评分向量是[1, 1, 1],使用余弦相似度计算会得出他们兴趣高度相似的结论。当p=2时,它就是欧氏距离。1.大数据的“4V”特征是指Volume(规模)、Velocity(速度)、Variety(多样性)和Veracity(真实性)。

2026-03-09 10:49:47 256

原创 终于把OpenClaw接入微信了,安全可控,详细教程看这篇

这个方案可以说是一举两得,同时把openclaw接入了企业微信和微信。但也有个不足之处,在微信中,这个机器人不能被加进群,只能单点聊。因为本质上它是个应用,而不是一个账号。

2026-03-06 10:53:04 3210 1

原创 刚刚,Claude正式被特朗普封杀,立即生效! 美国国防部已经正式通知Anthropic管理层,该公司及其产品被认定为供应链风险,即刻生效。

Anthropic目前的估值约3800亿美元(约合26188亿元人民币),而据The Information报道,Anthropic最近的年化收入突破了190亿美元(约合1310亿元人民币),较其去年年底的年化收入规模实现翻倍,进一步缩小与OpenAI的差距。与五角大楼的争端已经为Anthropic前景增添了不确定性。企业客户一直是该公司的核心业务,Anthropic在这一市场销售大量与编程相关的技术。被认定为供应链风险是否会长期影响Anthropic向企业客户销售产品,目前仍有待观察。

2026-03-06 10:49:36 417

原创 为什么林俊旸会离职? | 甲子光年 2019年,他以北京大学外国语言学及应用语言学专业硕士的身份毕业

在他的全面主导下,Qwen实现了从早期的雏形到Qwen 1.5、Qwen 2,再到2025年推出的Qwen 3系列的全尺寸开源爆发。据「甲子光年」了解,在此前Qwen的快速推进中,林俊旸一直极力试图在阿里内部维持一个“垂直整合”的研发闭环,覆盖从模型预训练、后训练与人类价值观对齐,直到底层基础设施优化的所有核心职能。在Hugging Face等全球主流的开源模型托管平台上,Qwen的生态地位已经跨越了单纯的“强力参与者”阶段,演变为真正的“霸榜者”,甚至能够与世界顶级的闭源模型直接竞争。

2026-03-05 17:27:15 388

原创 4.1.7微信双开

我前段时间也被这问题烦得不行,后来自己摸索出来这个办法;甭管你是想找mac如何双开微信的答案,还是想确保mac系统微信双开不翻车,我鹏磊这篇玩意儿都能给你整明白,一步步带着你走就完了;反正弄不明白你就多试几遍;这个方法我是在最新版微信4.1.6.11上测试的,绝对靠谱。

2026-03-04 22:56:50 217 2

原创 我用 OpenClaw 创办了16人AI团队:24小时不间断、高效运营!

我选的是多机器人模式。每个Agent对应一个独立的飞书应用,16个应用听着多,但配一次就完了。每个应用配置:创建应用、添加权限、获取凭证、配置事件订阅、发布应用。

2026-03-04 18:02:10 159

原创 Xbotics社区 | ArXiv 机器人学每日速递(2026.03.04)

进行交互和学习是机器人的中心挑战,提供了一个比劳动密集的人类演示更可扩展的替代方案。但实现这样的"游戏"需要:<1>对各种潜在分布外的环境状态鲁棒的策略,和<2>持续产生有用的机器人体验的过程。其次我们在真实世界中部署这个策略进行自主功能性游戏,通过任务选择、执行、评估和改进的持续循环,由视觉-语言模型的视觉理解能力引导。这些任务的特点不仅是接触密集的、力敏感的动力学,还有"隐含"的成功标准:不同于拿放任务,这些领域的任务质量是连续和主观的(例如土豆削皮有多好),这使得定量评估和奖励工程很困难。

2026-03-04 18:00:55 413

原创 Superpowers:CC 资深工程素养 Skills 库

规划 (Plan):将任务拆解为 2-5 分钟 可完成的“微任务”,明确文件路径与验证步骤。· 结构化思维:遵循 Design -> Plan -> Execute 的严密流程。· 准备 (Setup):自动创建隔离的 Git Worktree,验证测试基准。执行 (Execute):子智能体协作,执行严格的 Spec + Quality。· 模块化与插件化:深度集成 Claude Code 插件系统,支持热插拔。· 质保 (QA):强制 TDD(红-绿-重构)与 4 阶段。2. 标准化五步工作流。

2026-03-04 17:50:49 71

原创 [特殊字符] 装完 OpenClaw 不知道干嘛?先装这 5 个技能再说

不管你是想搞浏览器自动化、多 Agent 协同、GitHub PR 管理,还是想让 AI 帮你收发邮件、控制特斯拉,这里全都有。最懒的方式——在 OpenClaw 聊天框里直接贴技能的 GitHub 链接,说"用这个技能",助手会自己完成下载安装。这比在 ClawHub 里搜"code"、"test"、"refactor"这些关键词快多了。这不是"技能超市",这是"技能荒原"——没有导航、没有筛选、没有质量保证。真正的极客,是在安全优质的工具库里搭乐高,而不是在没有王法的垃圾场里扫雷。

2026-03-04 17:41:44 427

原创 上海一群青年,造了个学术版OpenClaw

比如DeepMind创始人哈萨比斯,他是一个极其综合之人,既有计算机的背景,也有神经生物学的背景,既开发过知名游戏,也是国际象棋大师,他把DeepMind打造出了非常好的融合氛围,可见想要把科学智能做到顶级,人与人的融合是必须的。面对学生提出的问题,大圣不会丢出死板的百科定义,而是编排出一条高效的教学workflow,串联起一场苏格拉底式的深度思辨,旨在培养学生的独立思考能力。更重要的是,实验数据自动回传,形成“设计-执行-反馈-优化”的干湿闭环,大幅提升了siRNA设计的成功率。

2026-03-04 17:33:33 415

原创 Django 创始人一针见血:AI 让代码不值钱了,但有样东西正在疯狂升值 我们需要建立新的习惯Willison 在文章最后坦诚地说,整个行业都还在摸索新的最佳实践,他自己也在摸索。但他给了一个

你一天能产出十倍的代码量,但如果没有能力判断哪些是好的哪些是烂的,那十倍的产出可能意味着十倍的技术债务。一个成熟的开发者,写几百行干净的、经过测试的代码,通常要花一整天甚至更久。因为当一个行业运转了几十年的核心成本结构突然变了,所有围绕这个成本建立起来的决策习惯、组织流程、评估标准,全都要跟着变。更夸张的是,现在一个人可以同时跑好几个并行的 Agent,一边写新功能,一边重构旧代码,一边跑测试,一边写文档。说到底,工具在变,成本在变,但有一样东西没变,就是你对质量的判断力和对问题的理解力。

2026-03-04 17:30:59 330

原创 AI 开发闭环了:从写代码到控制浏览器,中间不需要你 CLAUDE CODE × CHROME / WORKFLOW

Anthropic 刚刚把 Claude Code 和 Chrome 浏览器扩展打通了,意味着你的 AI 编程助手,现在有了一双手——能操作真实的浏览器,看到真实的页面,点击真实的按钮。这是工作内容的结构性变化——你还是那个做决定的人,但你手下多了一个不需要睡觉、不会抱怨、能同时操作代码编辑器和浏览器的执行者。它能看到页面实际渲染的样子,能读控制台的错误日志,能截图。如果发现问题——比如某个组件在暗黑模式下文字颜色没变,白字白底看不见——它会截图告诉你,然后直接定位到对应的 CSS 文件,问你要不要改。

2026-03-04 17:11:49 398

原创 突发!白宫正式封杀Claude:从反华先锋到国家公敌,他们只用了48小时。

但今天的前沿AI系统还不够可靠,无法驱动完全自主武器(人类完全出环、自动选择和打击目标)。因此,我指示美国政府的每一个联邦机构,立即停止使用Anthropic的所有技术。他痛斥Anthropic的高管层是激进的左翼疯子(LEFTWING NUT JOBS),指责他们试图用服务条款来勒索美国的战争部(Department of War,也就是五角大楼)是达里奥·阿莫迪(Dario Amodei)在走进五角大楼最后谈判桌前,拼尽全力向华盛顿证明:看,我还在帮你们打仗,我是自己人,我是可靠的爱国者。

2026-03-01 10:24:00 918

【长江证券】水下听风,智领深蓝【发现报告 fxbaogao.com】.pdf

【长江证券】水下听风,智领深蓝【发现报告 fxbaogao.com】

2025-06-04

搜索引擎概览 searchengine

搜索引擎概览 searchengine

2024-11-19

11个代码生成相关的论文,20241022更新版本-持续更新,包含代码搜索、代码搜索、代码模型survey、代码评论评估、代码评

find . -mindepth 2 -maxdepth 2 -type f -name "*.pdf" | awk -F/ '{print $(NF-1)}' | sort | uniq -c 2 代码或bug分类 1 代码搜索 1 代码生成 1 代码模型survey 1 代码评论评估 5 代码评估与提示

2024-10-22

10篇代码生成的论文,包括代码评估、代码搜索、代码生成、survey、代码或bug分类

题目 类型 分区 摘要 精读链接 Comparing large language models and humanprogrammers for generating programming code 代码评估 arxiv 评估七种LLMs在生成编程代码方面的性能,探讨不同提示策略对LLMs编码性能的影响,直接比较LLMs与人类程序员的编程能力,评估LLMs在不同编程语言之间生成和翻译代码的能力,以及考察LLMs的计算效率和从过去错误中学习的能力。 A Comparison of the Effectiveness of ChatGPT andCo-Pilot for Generating Quality Python Code 代码评估 会议 包括评估ChatGPT和Copilot在解决LeetCode编程问题上的有效性,探讨ChatGPT在接收到反馈后纠正代码的能力,以及其在提高代码质量和性能方面的潜力。 Program Code Generation with Generative AIs 代码评估 MDPI水刊-Algorithms非SCI 比较了人类生成的代码

2024-10-21

Multimodal Representation for Neural Code Search

—Semantic code search is about finding semantically relevant code snippets for a given natural language query. In the state-of-the-art approaches, the semantic similarity between code and query is quantified as the distance of their representation in the shared vector space. In this paper, to improve the vector space, we introduce tree-serialization methods on a simplified form of AST and build the multimodal representation for the code data. We conduct extensive experiments using a single corpu

2024-10-21

[MDPI水刊Algorithm非SCI]Program Code Generation with Generative AIs

[MDPI水刊-非SCI]Program Code Generation with Generative AIs

2024-10-21

Evolving code with a large language model

Evolving code with a large language model

2024-10-19

avx2_tensorflow-1.9.0-cp36-cp36m-win_amd64.zip

avx2_tensorflow1.9.0_win,avx2_tensorflow-1.9.0-cp36-cp36m-win_amd64.whl

2020-04-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除