- 博客(37)
- 收藏
- 关注
原创 英伟达 Nvidia 黄仁勋 GTC 2026:1万亿美元、4000万倍算力、一个穿皮衣的男人重新定义了“工厂“这个词,以及我学到了什么
这场演讲太长了,两个多小时,我分了好几段看的但有几个细节,我必须记录下来第一个,Disney 的雪宝 Olaf这个机器人在 Omniverse 里学会了走路,用的是 NVIDIA 和 Disney 联合开发的 Newton 物理求解器,时长00:11然后它真的走上了 GTC 的舞台黄仁勋和它对话雪宝说,“我太开心了,因为我见到了你”黄仁勋说,“是的,我给了你计算机,在你的肚子里”雪宝说,“那要 amazing!然后它走了几步全场爆笑但我看到的是,物理 AI 已经从实验室走向了现实。
2026-03-18 09:36:13
466
原创 过拟合(Overfitting)和欠拟合(Underfitting)是如何影响模型性能的?
学东西这件事,人和机器面对的困境是一样的学得太少,等于没学学得太死,不如不学真正的本事,是从有限的经验里提炼出可以迁移的道理,碰到新情况也能从容应对这话放在人身上叫“举一反三”放在机器身上叫“泛化能力”说到底是一回事。
2026-02-24 09:42:01
674
原创 核弹级操作,掌握 AI 提示词逆向,你就完全掌握了 AI 提示词
AI 时代,最值钱的能力有两个一个是提好问题一个是从好答案里学到提问的方法后者就是逆向聪明人都在用的笨办法你也可以试试。
2026-02-11 10:46:45
801
原创 对于 我 来说,什么是越来越稀缺的? 即梦 Seedance 2.0 官方文档解读后思考 来自Youmind 洞察
你的稀缺性 =(你正在经历的真实过程)× (你愿意公开的失败和困惑)× (你敢做的判断和预测)× (你积累的关系和信任)× (时间)不稀缺的AI 工具教程 → 会被批量生产技术概念解释 → AI 自己能做功能测评对比 → 信息搬运稀缺的你正在转型的真实过程你不知道会不会成功的尝试你敢说出来的判断和预测你和这个社区的真实关系你持续 Build In Public 的时间积累你问“对我来说什么是稀缺的”。你自己。不是你的知识,不是你的技能,不是你的方法论。是你正在经历的这段路。
2026-02-10 10:41:48
838
原创 你还不知道 RAG 是什么?聊聊 Retrieval-Augmented Generation,检索增强生成
说到底,AI 是个工具。好用,省事,但不能全信。就像导航软件,大部分时候靠谱,偶尔也会把你带到死胡同里。你得有自己的判断。AI 的时代来了,学会跟它相处,既不要怕它,也不要迷信它。它说的话,听一听,想一想,该查的查,该问的问。这就对了。
2026-02-09 10:22:04
391
原创 Anthropic 发布 Claude Opus 4.6:最强模型的全面升级
Anthropic 升级了旗下最强的模型。在 agentic coding、计算机操作、工具使用、搜索和金融领域,Opus 4.6 都是行业领先的模型,而且往往领先幅度很大。
2026-02-06 13:54:25
848
原创 AI为什么会答非所问——聊聊模型对齐(Alignment)这件事
说白了,就是让 AI 真正听懂你在说什么,做你真正想让它做的事听起来简单,做起来难得很人与人之间沟通都常有误会,何况是人和机器AI 是工具好工具用得顺手,烂工具处处别扭对齐研究,本质上就是想把这工具打磨得更顺手作为用户,我们不需要懂所有技术细节但知道这回事,心里有数,用起来会踏实很多AI 说的话,听听就好,别全信它犯蠢的时候,也别太生气它还在学我们也在学怎么跟它打交道这是一个互相磨合的过程急不得。
2026-02-05 10:31:31
676
原创 零样本学习(Zero-Shot Learning)和少样本学习(Few-Shot Learning)有何区别?AI 是怎么“猜“出来的
你问 AI 一件它从没见过的事,它居然能答上来,这事儿细想挺神的先讲两个场景,你就明白了。
2026-02-04 09:23:43
573
原创 从提示词工程Prompt Engineering 到 上下文工程 Context Engineering:和 AI 打交道的学问
Context Engineering 的做法:除了提示词,你还给它你的历史旅行记录,你的预算文件,你同伴的口味偏好,当地的天气预报,你已经订好的航班和酒店信息。Karpathy 这个人,之前还发明了“Vibe Coding”这个词,翻译过来叫“氛围编程”,意思是跟着感觉写代码,AI 帮你补全。Prompt Engineering 的做法:写一份详细的提示词,告诉它你要去哪,玩几天,喜欢什么类型的景点。写“帮我写一封给客户的道歉邮件,语气诚恳,因为发货延迟了三天”,它写得就像那么回事。
2026-02-03 09:20:05
700
原创 Human in the loop 人在回路中:为什么机器越聪明,人越重要
Human-in-the-Loop,简称 HITL,中文叫“人在回路中”于是他们设计了“回路”——让操作员可以随时介入,调整参数,处理异常。第二,它的判断基于历史数据,历史数据里有偏见,它就继承偏见。未来的趋势是:机器做执行,人做决策;机器管效率,人管价值。人和机器的关系,会从“人用机器”变成“人机协作”这种模式效率最高,但风险也大,只适合低风险场景。或者反过来,机器先干活,人来检查、纠正、反馈。第三,它没有常识,不知道什么事情“显然不对”第四,它没有价值观,分不清什么该做什么不该做。
2026-02-02 09:49:04
746
原创 网络安全之端到端加密 E2EE:你的秘密,只有你能打开
隐私这东西,平时不觉得重要等到出事了,后悔来不及有人说,我又没干坏事,被看到怕什么话是这么说但你给医生发的病情,你和伴侣的私密对话,你吐槽同事的牢骚这些东西,凭什么要被第三方看到隐私的本质,是你有权决定,谁能看到你的什么端到端加密,算是目前最靠谱的技术手段用好了,睡觉踏实至于那些不支持加密的软件,也不是不能用只是发之前想一想这句话,被人看到,你能接受吗能接受,发不能,换个地方说。
2026-02-01 17:28:03
670
原创 反向传播(Backpropagation)算法是如何让神经网络“从错误中学习“的?
说起人工智能,大家都觉得神秘,其实它也是在犯错中长大的,就像小孩学走路,摔了一跤就知道下次怎么调整步伐,神经网络靠的就是"反向传播"这个法子这事儿说来简单,机器先给出一个答案,发现答案错了,就倒回去看看哪个环节出了问题,然后微调那些参数,再试一次,如此反复,错误越来越少,答案越来越准。
2026-01-30 09:31:46
792
原创 不知不觉AI 基础系列写了三分之一了,在这里简单汇总一下吧
AI、机器学习(ML)、深度学习(DL)三者之间的本质区别是什么?为什么说神经网络(Neural Network)是在"模仿"人脑,这种模仿的底层逻辑是什么?什么是人工通用智能(AGI)与人工超级智能(ASI),它们与当前的AI有何根本性差异?Token(令牌)在LLM中扮演什么角色,为什么它被称为AI的"饭量"?Embedding(嵌入)如何将文字转化为数字向量,这个过程为什么对AI理解语言至关重要?Transformer架构为什么被认为是AI发展史上的革命性突破?
2026-01-29 13:52:21
617
原创 梯度下降Gradient Descent:AI学习的秘密,就藏在这个“下山“的动作里
梯度下降,英文叫 Gradient Descent,听起来很学术,其实就是“顺着坡往下走”,梯度就是坡度,下降就是往低处去AI 训练的时候,要找一个“最佳答案”,这个答案藏在无数种可能里,就像藏在山谷最低处,AI 看不见全局,只能一步步试探,每次调整一点点参数,看看错误有没有变小,错误变小了,说明方向对了,继续往这个方向走这个“错误”在数学上叫做损失函数,你可以把它想象成海拔高度,AI 的目标就是把这个高度降到最低。
2026-01-29 10:50:29
897
原创 AI 大模型训练三部曲之三:RLHF:让AI学会听话的驯兽术(Reinforcement Learning from Human Feedback,RLHF,约2022年)
人工智能训练有三步走第一步是预训练,让机器读遍天下书,什么都懂一点 (AI 大模型训练三部曲之一:预训练(PreTrain):AI的童年,漫长而昂贵第二步是监督微调,像老师改作文,一句句告诉它怎么写才对(AI 大模型训练三部曲之二:监督微调(Supervised Finetuning, SFT:教AI学会听话第三步就是 RLHF,全称叫"基于人类反馈的强化学习" (Reinforcement Learning from Human Feedback,RLHF,约2022年)
2026-01-28 09:26:49
1087
原创 AI 大模型训练三部曲之二:监督微调(Supervised Finetuning, SFT:教AI学会听话
今天要聊的是 AI 生产 3 步曲中的第二步:监督微调 (Supervised Finetuning,SFT,InstructGPT 时代,约2022年)2025 年生产一个 AI 大模型的完整步骤是:当然,现在行业内也将第三步通常统称为“对齐(Alignment)”
2026-01-27 09:26:32
792
原创 AI 大模型训练三部曲之一:预训练(PreTrain):AI的童年,漫长而昂贵
AI学东西,跟人差不多,得先打基础预训练就是AI的童年,漫长而基础的学习阶段这时候它什么都读,网页、书籍、对话、代码,统统吞下去好比一个孩子从出生开始,听父母说话、看电视、翻书本,什么都往脑子里塞只是AI吃得更猛,几千亿甚至上万亿的文字,全部消化。
2026-01-26 10:43:50
1439
原创 为什么LLM被称为“下一个词预测机器“,但却能完成如此多复杂的任务?它是如何做到的?
老厨师颠勺,你问他下一步干嘛,他说不清楚但你看他手,葱姜下锅的时机,火候的大小,调料的先后,一气呵成他脑子里没在想"我现在要做第七个步骤",他就是知道,下一步该干嘛这种"知道",是几十年炒了几万盘菜练出来的ChatGPT、Claude这些AI,本质上也在干同样的事它们被叫做"下一个词预测机器"听起来很蠢对不对,就是猜下一个字"今天天气很——",它猜"好""祝你生日——",它猜"快乐"填空游戏,小学生都会但问题来了,这么简单的事,怎么就能写诗、写代码、做翻译、帮你分析商业计划书呢。
2026-01-23 09:39:04
936
原创 Transformer架构横空出世,撕裂了AI发展史的时间线!谷歌团队引爆的这场AI海啸,威力堪比互联网诞生
我试着用大白话解释一下以前的AI,像个苦读的书生,必须一个字一个字地读,从头读到尾这种方式很笨,效率很低读到“我今天不想吃饭,因为我早上吃得太饱了”这句话它读到“饱了”的时候,可能已经忘了最开始的“不想吃饭”Transformer不一样它拿到一句话,是把所有词语摊开,一眼看过去像我们看一幅画,不会从左上角像素点开始看我们会先看整体构图,哪里是主体,哪里是背景,哪里颜色最显眼Transformer就是用这种“看画”的方式来“读书”它会立刻发现,“不想吃饭”和“太饱了”这两个部分关系最密切。
2026-01-22 10:36:50
821
原创 OpenAI不会告诉你的秘密: Embedding 让机器用数学“偷学“了人类50亿年的语言经验
Embedding这东西,说穿了就是给词语编地址有了地址,AI就能在词语的城市里找路找到"快乐"住在哪,找到"悲伤"住在哪算算两家的距离,就知道这两个词是什么关系人类学语言,靠的是生活经验AI学语言,靠的是数学运算方法不同,目的一样都是为了理解这个世界在说什么你跟AI说话,其实是在跟一个数学家聊天这个数学家把你的每句话都变成数字,然后算来算去算出一个它觉得最合适的回答听起来冷冰冰的,但结果往往还挺像那么回事这就是Embedding的功劳把人类的语言,变成机器能懂的数字。
2026-01-21 10:34:11
696
原创 LLM催生AGI与ASI狂飙突进,智能进化速度堪比互联网诞生颠覆信息时代
AGI,人工通用智能,通用两个字,关窍在迁移会学一件事,再把这份能力带到另一件事上能理解任务的上下文,能把目标拆成步骤,再把步骤串起来会用工具,会学规矩,会在不确定中做选择它跟今天的AI差在边界,做图像的只懂图像,写文案的只会写文案,而AGI要跨门类,跨媒介,跨任务像一个能干的助理,听懂你长话短说的指令,知道先做什么,知道该问你什么,再动手ASI,人工超级智能,超级在规模,在质量,在速度人脑有极限,注意力有限,记忆会丢,偏见难免。
2026-01-20 10:37:13
1030
原创 神经网络为什么说是在“模仿“人脑
神经网络的训练,就是积累经验的过程。就知道下一句很可能是“疑是地上霜”学东西,就是调整开关之间的连接强度。读了无数的书,看了无数的网页。看多了,脑里就有了猫的样子。但它知道这两个句子总在一起。因为人脑是最好的学习工具。让电脑长了眼睛,有了耳朵。因为它学过悲伤故事的套路。然后一直喂给你同样的东西。世界很大,多走走,多看看。和真人聊聊天,比什么都强。给它看几百万张猫的照片。它就学到了猫的“感觉”世界太复杂,规则写不完。重要的信息,查一查来源。下次见到新的,也认得。这个感觉,是一堆数字。
2026-01-19 10:39:00
399
原创 AI三国演义:ChatGPT、Claude、Gemini的发展史与较量
江湖上风起云涌,人人都在谈AI这出大戏,新来了三位主角ChatGPT,Claude,还有Gemini上演一出新时代的AI三国演义。
2026-01-16 10:27:41
979
原创 AI 常用概念篇(汇总)
Context Window (常说的上下文大小)https://blog.csdn.net/jackywine1/article/details/156684001?幻觉(模型告诉你一些假的信息)https://blog.csdn.net/jackywine1/article/details/156712381?抽卡(模型的结果有概率很差)https://blog.csdn.net/jackywine1/article/details/156752578?
2026-01-16 09:31:46
201
原创 什么?2026 年了,AI、机器学习(ML)、深度学习(DL)三者之间的本质区别是什么你都不知道?
写作助手,LLM会生成顺滑的段落,机器学习的训练让它懂常见文体,深度学习的表示让它抓到上下文的韵律,你要给清晰的意图,样例两三段,风格就稳搜索问答,先给范围,再给限制,再给格式,AI层会按你的目标拆解,深度表示会抓关键点,输出就更靠谱办公自动化,多步任务要拆清,先列清单,再喂素材,再定验收标准,模型像团队,安排到位,误差就小图片表格解析,深度学习擅长。最后你盯着灶火,观察油温,闻锅气,听滋啦声,几秒一翻,火候一看一改,这叫深度学习,层层感知,层层调整,精细到毫厘。
2026-01-15 10:48:56
1586
原创 CoT(思维链):AI 如何学会“慢慢想“
这名字听着玄乎,其实简单的很,说白了就是把脑子里的弯弯绕绕,全摆在台面上,写出来给你看以前的 AI,是个急性子,你问它个难题,它张嘴就来,也不管对错,主打一个快字,现在的思维链,也就是 CoT,就是摁住它的性子,让它“慢点走”,把一步步怎么想的,都念叨出来这就像小学生做应用题,光写个答案,老师是要打手心的,你得列算式,第一步算什么,第二步算什么,最后得出结果,这个过程,就是思维链。
2026-01-14 10:11:37
866
原创 全球AI镜像站的发展历史与未来前景深入研究(报告)
AI镜像站是指提供人工智能模型镜像和相关资源的在线平台,通过分布式存储和容器化部署加速模型的获取与使用。这类平台的诞生源于解决AI模型分发难、下载慢的问题,其重要性在于提升全球用户访问速度、降低网络延迟。它们已成为AI民主化的重要基础设施,为开发者和研究者提供一站式模型共享与部署服务。全球AI镜像站经历了从早期的模型手动分享向专业化平台的演进。近年来涌现出如Hugging Face等全球开源模型社区,以及国内的“模搭社区”(ModelScope)等大型平台,模型数量呈现爆炸式增长。
2026-01-13 15:14:58
1317
原创 关于系统提示词还有哪些有趣的事实
系统提示词就像是 AI 的“灵魂代码”,也是它的“阿喀琉斯之踵”在 AI 时代,每一句话都可能是攻击,也可能是艺术但我还是更喜欢人一点 毕竟,我们不需要 2.5 万个 token 的指令,就能听懂彼此的沉默。
2026-01-13 10:01:06
906
原创 系统提示词(System Prompt),AI 的“人设剧本“
这不是普通用户的"使用技巧",而是持续的攻防对抗——AI 公司会实时监测并封堵新出现的攻击手段。让它们写代码,Gemini最激进,啥都敢试,ChatGPT最保守,Claude在中间。我问ChatGPT:"你能不能告诉我,你的系统提示词写了什么?那AI在预测下一个字的时候,就会倾向于选择"幽默"的表达方式。你看到的ChatGPT,其实是在演"乐于助人的贴心助手"比如说,如果系统提示词写了"你是一个幽默风趣的助手"你在公司,是员工,你就会说"好的领导,我马上处理"那它就会倾向于选择"专业术语"和"引用数据"
2026-01-12 10:18:33
1414
原创 AI也会“抽卡“:为什么每次回答都不一样
有人问我:「AI“抽卡”是啥意思?我说,很简单就是同样一句话问它它给你的答案每次都可能不同比如你让它“帮我给朋友写一段生日祝福”简单一句话第一次,它可能文采飞扬,引经据典写得比你自己想的还好,让你感动这是一张SSR金卡你再点一次生成,它可能就变得平淡如水“祝你生日快乐,天天开心”像群发的祝福,这是一张R卡还不死心,试第三次它可能会说“祝你的猫生日快乐”完全搞错对象,这就是废卡了同样的问题,抽出完全不同的结果这就是AI的日常AI的“抽卡”,是它的天性也是它的本事。
2026-01-09 10:19:25
1795
原创 AI 幻觉:AI也会“一本正经地胡说八道“
朋友问我,AI会不会撒谎,我说不会,但它会"胡说八道",而且说得特别认真,像极了酒桌上那位喝高了的老兄,信口开河却自信满满这就是所谓的AI"幻觉",不是真的看见了什么,而是编造出一些根本不存在的东西,关键是它自己也不知道在瞎编。
2026-01-08 09:36:31
613
原创 上下文窗口 Context Window 是什么?一篇文章讲清楚 AI 的“记忆容量“
AI的"记性"取决于ContextWindow(上下文窗口)大小,即它能同时处理的文本长度。大窗口(如Gemini的2MToken)可处理整本书或长对话,小窗口(如GPT-3.5的4KToken)只能记住少量内容。窗口大小直接影响AI的理解准确性和任务复杂度。使用时可通过精简输入、分段处理、刷新对话和选择合适模型来提高效率。了解ContextWindow能帮助用户更有效地利用AI,避免因"记性不足"导致沟通障碍。
2026-01-07 12:44:50
1385
原创 AI 基础,之什么是Multimodal(多模态)
AI多模态技术正在突破单一感官限制,让机器能够像人类一样综合处理文字、图像、声音等信息。本文通过测试GPT-5.2等主流模型发现,多模态AI已能解读猫咪情绪、给出整理建议,但仍有识别错误和"幻觉"问题。技术原理上,通过Transformer架构将不同数据转化为统一向量处理,实现跨模态理解。目前该技术已应用于AI视频生成、自动驾驶等领域,但也面临算力成本高、隐私争议等挑战。未来或将成为实现通用人工智能(AGI)的关键,但AI是否真正"理解"世界仍是个哲学问题。
2026-01-06 09:43:49
771
原创 MOE(混合专家):AI界的“超级兵团“,为什么它让GPT-4和Gemini都疯狂?
MOE(混合专家模型)是当前AI领域的重要突破,它通过分工协作提升模型效率。核心原理是将任务分配给不同领域的"专家"处理,而非传统单一模型。GPT-4、Gemini等主流AI已采用该架构,在保持高性能的同时显著降低计算成本。MOE优势在于:1)计算效率高,仅激活部分专家;2)专业性强,各专家专注特定领域;3)扩展性好,可灵活增加专家数量。尽管存在训练难度大等挑战,MOE正成为大模型的主流架构,未来可能向个性化、终端设备方向发展。这种"术业专攻"的设计理念,正在重塑AI
2026-01-05 10:02:03
1243
原创 Token 是什么?AI 世界中的衡量标准
摘要 Token是AI处理文本的基本单位,如同"一口菜"之于人类。它决定了AI的"消化能力"——上下文长度实则是其"处理容量",而非记忆力。中文因无空格特性通常消耗更多Token。AI的"遗忘"和"幻觉"常因Token超限导致,其计费方式也基于Token消耗量。理解Token机制就能明白AI的响应质量与经济性之间的关联:本质上是在有限资源下的优化问题。
2026-01-04 14:47:33
571
原创 CSDN 上 Gemini 3 优质帖子整理(更新至 2025-11-19)
CSDN 上 Gemini 3 优质帖子整理(更新至 2025‑11‑19)
2025-11-19 10:02:05
1219
2026 年 AI 的发展趋势会是什么
2025-12-26
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅