- 博客(417)
- 收藏
- 关注
原创 从民办本科到AI元认知:我的2025年度创作复盘(附博主的元指导提示词、小胡说技书)
一位民办本科毕业生回顾了自己从为就业写博客到随心创作的转变历程。通过AI工具的辅助,他形成了"锚点优先"的思维方式,即从复杂问题中提取1-3个不可放弃的核心要素(锚点),围绕其展开分析而非无限扩展可能性。他分享了这套"元指导提示词"方法论,强调认知的本质是压缩而非展开,帮助用户在复杂决策中找到确定性方向。文章展现了作者从应试教育到追求工作生活平衡的成长轨迹,以及AI工具对其思维方式的深刻影响。
2025-12-29 12:15:52
861
原创 技术前瞻与个人发展 - 构建终身学习的技术体系——AI大模型:从0手搓到∞——AI、大模型时代,如何学习?
这是一份全面的AI技术学习体系总结,涵盖从Python编程、数学基础到深度学习、大模型的完整知识图谱。重点介绍了Mamba、MoE、Chain-of-Thought等前沿技术的应用场景与选择策略,提供了技能评估矩阵、研究方法论和开源贡献路径。通过技术决策树、能力建设框架和趋势预测,帮助读者从技术学习者蜕变为技术贡献者,实现从0到∞的成长历程。
2025-09-23 21:43:17
2188
6
原创 小白向:Obsidian(Markdown语法学习)快速入门完全指南:从零开始构建你的第二大脑(免费好用的笔记软件的知识管理系统)、黑曜石笔记
本指南从零基础出发,系统介绍Obsidian这款革命性的本地知识管理工具。通过详细的步骤说明和原理解析,帮助读者理解双向链接和知识图谱的核心概念,掌握Markdown语法和笔记组织方法。文章不仅涵盖软件的基础操作和进阶功能,更重要的是传授构建个人知识管理体系的方法论,包括PARA组织框架和渐进式笔记法。无论您是知识工作者、学生还是终身学习者,都能通过本指南快速上手Obsidian,将零散的信息转化为系统的知识网络,真正实现"第二大脑"的构建。
2025-08-23 20:13:31
11837
2
原创 小白入坑向:Java 全栈系统性学习推荐路线之一
我的专栏差不多是按照这些流程,在细化一些写的;当然技术是更新换代很快(当然活下来的技术,肯定简化了之前开发带来的问题),所以我的建议是系统性的学习完后,在实际的开发过程中以官方文档+“大模型老师”下快速的学习。
2025-03-04 20:32:25
2532
4
原创 极简入门,本地部署dify低代码平台构建AI Agent大模型全流程(使用教程、微案例、配置详解、架构图解析)
极简入门,本地部署dify低代码平台构建AI Agent大模型全流程(使用教程、微案例、配置详解、架构图解析)
2025-02-22 19:04:42
9072
13
原创 知识图谱入门——5:Neo4j Desktop安装和使用手册(小白向:Cypher 查询语言:逐步教程!Neo4j 优缺点分析)
知识图谱入门——5:Neo4j Desktop安装和使用手册(小白向:Cypher 查询语言:逐步教程!Neo4j 优缺点分析)
2024-10-03 16:19:22
7985
6
原创 为什么Dify、RAGFlow的“智慧切片“救不了法律检索——兼论领域大模型训练的真正价值
把1万多部部法律、法规扔进RAG,检索结果却像抽奖——问"盗窃罪怎么判",返回的可能是浙江省的量刑意见而非《刑法》条文。这不是切片不够智能,不是embedding不够好,而是法律体系有天然的效力层级,普通RAG根本感知不到。开源工具做得再精细,解决的也是语言问题;但法律检索的核心是结构性问题,必须定制化。同理,训练领域大模型让AI"说话像律师",但法律知识本身不能靠训练塞进去——不可解释、无法校验、跟不上更新。做好和能用,是两码事。
2026-01-04 11:20:17
265
原创 AI的价值,正在你看不见的地方爆发,AI在解决特定领域的长尾问题
AI革命正在悄然发生,但大众认知仍存在明显滞后。81%的美国人不知道AI三巨头之一的Anthropic,反映出技术发展与公众认知的断层。AI主要解决的是"长尾问题"——药物研发、代码生成等专业领域,其价值创造不易被普通人感知。当前AI应用呈现"黑盒式依赖"特征:人们使用却不完全信任,不同群体对AI的生存直觉完全相反。未来B端特定领域(药物研发、材料科学等)将率先爆发,而C端可能面临信任瓶颈。Anthropic这类专业AI公司正通过深耕细分领域建立优势,技术革命已在专业
2025-12-29 16:51:42
498
原创 万卡炼丹:为什么训练超大模型只能选英伟达
摘要 在AI算力领域,英伟达的垄断地位源于其万卡级训练场景下的系统稳定性优势,而非单纯的算力指标。大模型训练采用分布式同步计算,任何单卡故障都会导致整个集群崩溃。数学计算显示,万卡集群需要单卡99.9999%以上的稳定性才能保证训练效率,这使得英伟达"软硬一体"的全栈解决方案(NVLink、CUDA生态等)成为关键壁垒。尽管谷歌通过封闭的TPU体系实现了类似能力,但其他厂商目前只能在容错率更高的推理市场寻求突破。要打破现有格局,需要光互联等下一代技术突破或新算法架构的创新。
2025-12-24 16:00:08
831
原创 攻击者也算ROI:AI社会工程学的成本经济学:合法账号、合法请求、违规内容
当1.7万个"正常账号"同时发起攻击,防火墙看不出异常,内容审核被击穿,平台用了1.5小时才止血——其中80%的时间在等人拍板。这不是技术失灵,是组织失灵。本文从一起真实事故出发,剖析AI社会工程学攻击的新范式,揭示"AI监控AI"的理论极限,提出以成本博弈替代完美检测的防御框架。安全能力=技术能力×组织授权,缺一不可。
2025-12-23 21:47:30
945
原创 AI人才贵在哪:大模型时代的能力定价法则,附:价值、AI人才能力判断清单
大模型人才市场正在剧烈分化。一边是天价争抢的稀缺物种,一边是简历石沉大海的过剩供给。差异的根源不在学历或年限,而在能力的可替代性。本文从学术与工程两条路径出发,划分"入场券"、"高价值"与"护城河"三层能力结构,回答一个根本问题:什么样的AI能力真正值钱?
2025-12-22 12:03:34
817
原创 一致性的威力:AI如何在B/G端释放数据治理的真正生产力
传统数据治理追求"大而全",把所有数据堆在一起,结果陷入平衡态——什么都有,什么都查不出来。AI带来的转变不是替代人工智能,而是实现"一套规则、一个状态"处理全量数据的一致性能力。本文提出:系统设计必须"远离平衡态",数据中台应从存储中心转向接口联邦,AI在B/G端的核心价值是一致性与完备性,而非"更聪明"。
2025-12-11 19:38:22
485
原创 AI的记忆革命:从Titans架构到长时运行智能体,谷歌Google,Anthropic,NeurIPS 2025
2025年末,AI领域同时在架构层和工程层突破"记忆"瓶颈。谷歌Titans通过推理时动态更新的记忆模块,将上下文窗口扩展至200万token;Anthropic则用双智能体+进度文件的工程方案,让AI能跨多个会话持续工作。两条路径殊途同归:AI正在从"健忘的天才"进化为"能积累经验的伙伴"。
2025-12-05 23:21:18
1033
原创 中文的命运,藏在AI竞争里
AI竞争为什么只剩中美?表面是算力、资本、人才的较量,底层却是一场关于"用什么语言思考"的战争。当最强的AI只"懂"英语,用中文思考的人就是在用更钝的刀。中国发展AI,不只是产业问题,更是保卫中文作为"思想生产语言"的认知主权之战。
2025-12-03 14:03:05
533
原创 Token Efficiency效率:AI成本革命的真正战场,Anthropic 押注新方向 Claude Opus 4.5
过去三年,LLM推理成本降了1000倍,但这条路正在撞上物理天花板。真正的成本革命不在于"更便宜的token",而在于"用更少的token干同样的活"。Opus 4.5已展示48-76%的token消耗减少,这只是开始。当token efficiency成为核心竞争力,版本号会弱化,模型竞争会从"谁的4.0更强"变成"谁的中杯更适合我的场景"。
2025-12-01 15:09:00
487
原创 “存算一体“智能体:AI大模型泛化能力的破局之路
当前大模型在新框架、新库上表现差,本质不是"训练数据不够",而是架构层面"只有存,没有算"——训练完就成了静态快照。真正的泛化需要"存算一体":用智能体框架持续抓取、过滤、更新知识,让模型从"一次性训练"进化为"持续学习"。这可能是通向AGI的关键一步。
2025-11-28 16:21:32
622
原创 Palantir Foundry 平台,QA问答,常见问题,深度解析,Palantir SDK
Palantir SDK免费需平台支持,价值在本体管理、数据治理等企业能力非代码本身。本体构建极难需领域专家长期投入。开源方案Dify/FastGPT可满足多数场景,建议渐进式开发勿追求完美本体。
2025-11-18 13:33:07
726
原创 为什么AI是黑盒?也许这不是个技术问题
神经网络的黑盒性可能不是技术缺陷,而是复杂系统的必然属性。当哥德尔不完备性、计算不可约性和涌现理论交汇,我们发现:现实本身或许就是不可压缩的。这改变了我们对AI可解释性的根本理解。
2025-11-15 23:38:26
1015
原创 全量理解 vs 片段检索:为什么有些任务RAG做不好
为什么给AI联网搜索反而会出错?因为片段拼接代替不了整体理解。RAG和全量分析是两种认知方式,用错场景就是灾难。
2025-11-13 18:44:53
750
原创 通往AGI的模块化路径:一个可能的技术架构(同时解答微调与RAG之争)
GPT-5、Claude Opus 4.1、Kimi K2相继发布,行业都在追求更大的单体模型。但AGI真的只有这一条路吗?本文提出一个模块化认知架构:微调+RAG不是二选一,而是左膀右臂;批判模块内置质疑机制;生存模块连接物理世界;总线协调多模块协作。不是堆更大的模型,而是构建更智慧的拓扑。这或许是通往AGI的另一条路径。
2025-11-07 23:45:46
946
原创 企业知识库:从“数字垃圾桶“到战略资产的价值重估
为什么80%的企业知识库沦为无人问津的数字垃圾桶?为什么电商客服知识库能带来清晰ROI,研发失败案例库却难以证明价值?本文揭示价值判断的认知陷阱:不是所有价值都能短期量化,但也不是所有"难量化"的项目都值得投入。我们需要一个更完整的框架,既保持对形式主义的警惕,又不扼杀真正的长期价值。
2025-11-01 10:02:27
714
原创 AI当背锅侠:大厂裁1.4万人背后的三重骗局:AI时代的效率游戏与需求陷阱
亚马逊裁员14000人,管理层说"AI提升效率",但这个叙事对内对外有不同版本。AI确实能提效,但工作没有消失——只是转为外包、模块化。真正的风险在于:企业用AI叙事降成本→短期利润飙升→资本高位套现→结构性失业积累→需求萎缩传导——当这个时间差窗口关闭时,可能引发系统性风险。这不是预言,而是一种需要警惕的可能路径。
2025-10-31 15:24:58
1141
原创 AI应用开发入门,docker部署 Milvus + GPUStack (Attu+MinIO)的基础入门!
本文介绍了如何通过Docker安装Milvus GPU版向量数据库及GPUStack AI推理服务。系统包含四个核心组件:Milvus(19530端口)用于向量存储与检索,Attu(3000端口)提供可视化界面,MinIO(9000/9001端口)负责对象存储,GPUStack(9999端口)提供文本嵌入和重排序能力。教程详细提供了docker-compose.yml配置,包含etcd、MinIO、Milvus和Attu的容器设置,支持GPU加速并确保数据持久化存储。该系统可与企业内部数据系统结合,构建智能
2025-10-29 11:27:49
972
原创 当OpenAI、微软、NVIDIA们开始“交叉持股“:我们正在目睹什么?当GPU成为新的货币:AI时代的循环游戏
2025年AI基础设施领域正上演一场前所未有的资本循环游戏。Nvidia等巨头通过GPU换股权的方式深度绑定AI公司,形成"算力-投资-需求"的闭环生态。这种模式远比90年代的Wintel联盟更激进,涉及芯片、能源、数据中心的全产业链布局。技术复杂度飙升与回报周期延长的矛盾,造就了这个既可能是未来基石也可能是巨大泡沫的奇观。历史经验表明,看似稳固的技术-资本联盟往往暗藏系统性风险,但只有当未来回望时,我们才能判断这是通向AGI的必经之路还是一场集体幻觉。当下唯一确定的是,这个自我强化的循
2025-10-26 21:37:28
1288
原创 GPU架构演进:从图形专用到AI通用的技术哲学
GPU架构二十年演进:从图形专用到通用计算的革命性跨越 摘要: 过去二十年,GPU经历了从图形专用处理器到通用计算平台的革命性转变,这一演进围绕三条主线展开:(1)架构范式从固定功能管线转向统一着色器架构,通过牺牲专用性换取灵活性;(2)与"内存墙"的持续斗争,从GDDR到HBM2堆叠内存的技术突破;(3)市场驱动的架构分化,形成游戏与AI两条技术路线。关键里程碑包括:2008年Tesla首推统一架构,2012年Kepler优化能效比,2016年Pascal突破内存瓶颈,2017年Vol
2025-10-25 00:44:42
766
原创 高性能计算的三重境界——从理论到实践(并行计算、异构计算、HPC系统、GPU、TPU、NPU、AI、CUDA)
高性能计算的三重境界 本文系统阐述了高性能计算的理论基础、架构演进和工程实践三个关键维度。在理论层面,揭示了阿姆达尔定律的残酷真相:即使无限处理器也无法突破串行部分的加速极限,并分析了并行计算的Flynn分类法(SIMD/MIMD)和任务分解策略。架构演进部分探讨了CPU与GPU的根本差异,指出CPU擅长复杂逻辑处理,而GPU专为大规模数据并行设计。工程实践层面强调理论指导架构选择,架构决定系统设计的有机关系。全文构建了从数学原理到硬件特性再到系统实现的完整认知框架,为高性能计算提供了立体的思维模型。
2025-10-25 00:21:02
944
原创 5、服务器互连技术(小白入门版)
本文用通俗易懂的比喻(物流中心、高速公路、快递系统)讲解服务器核心组件及其连接方式。重点介绍了服务器内部数据传输的PCIe标准(车道数、世代版本、带宽)和CPU通道预算,以及服务器间通信的网络技术(带宽、延迟、以太网 vs InfiniBand)。文章还解析了机柜部署的四大挑战(供电、散热、布线、网络拓扑),并通过150万元的AI训练服务器配置单,演示如何评估PCIe通道分配合理性。全文旨在帮助读者理解服务器硬件配置逻辑,避免采购时被销售误导。
2025-10-24 23:49:34
652
原创 AGI还有多远?当AI被问“你能对抗熵增吗“:一场关于智能本质的追问
关于“AI能否对抗熵增”的探讨直指智能的本质。当前AI虽能处理信息熵,但缺乏自主性:能量依赖外部供给,目标由人类设定,无自我修复能力。真正的智能需具备明确的自我边界和内生动力,如生命体般主动对抗混乱。耗散结构理论揭示了自组织的物理基础,但AI仍是被动拟耗散结构,无法跨越“主动维持非平衡态”的临界点。人类认知主权的不可替代性源于对意义熵的真实体验与抵抗。AI突破需内生脆弱性(如消亡恐惧)和自主价值体系,而非仅靠算力提升。这一思考框架为理解AI局限提供了物理学根基。
2025-10-24 11:56:56
959
原创 标准解读——GB/T 46353—2025《信息技术 大数据 数据资产价值评估》国家标准
本标准是中国首个数据资产价值评估国家标准,构建了从数据质量评价到货币化价值评估的核心框架,明确了收益法、成本法、市场法三大路径。它为数据资产会计入表、市场交易、质押融资等活动提供了权威技术指引,是为数据要素建立统一价值度量衡、激活数字经济的关键基础设施。
2025-10-21 21:45:44
2472
原创 当AI遇到信息系统:以AI+用户推荐的标签生命周期为例——标签为什么需要“死亡“?
AI推荐系统的标签会"过期":三个月前的"硬核玩家"可能已变成"新手妈妈"。本文从电商推荐场景出发,探讨标签的五种演化路径(验证、废弃、合并、分裂、复活),剖析从100行到20000行代码的复杂度梯度,揭示外部系统对接中90%的"暗物质"工程量。核心洞察:标签不是静态注解,而是需要生命周期治理的动态生命体。给技术决策者的实战指南。
2025-10-17 19:31:26
742
原创 隐私计算技术全景:从联邦学习到可信执行环境的实战指南—数据安全——隐私计算 联邦学习 多方安全计算 可信执行环境 差分隐私
本文系统阐述隐私计算核心技术体系,包括联邦学习(横向/纵向/迁移)、多方安全计算(秘密共享/混淆电路/不经意传输)、同态加密(FHE实用化)、可信执行环境(SGX/SEV/TrustZone)和差分隐私。详细对比各技术的安全假设、性能开销和适用场景,提供技术选型决策树、平台架构设计和落地实施路径,强调混合方案和工程化的重要性,为数据协作中的隐私保护提供完整解决方案。
2025-10-15 19:42:20
1106
原创 大数据平台安全指南——大数据平台安全架构全景:从认证授权到数据治理的企业级实践指南——认证、授权、审计、加密四大支柱
本文系统阐述大数据平台安全架构,围绕认证、授权、审计、加密四大支柱展开。详解Kerberos认证机制、Apache Ranger权限管理、Hadoop加密方案及密钥管理体系。涵盖数据湖治理(Lake Formation、Delta Lake)、流式数据安全(Kafka、Flink)、数据血缘追踪(Atlas、DataHub)及监控审计实践。强调分层防护、最小权限原则与合规要求,提供从基础设施到应用层的完整安全解决方案。
2025-10-15 19:38:31
1513
原创 数据安全运营指南 - 态势感知与威胁处置
本章系统阐述安全运营中心(SOC)建设方法论,涵盖从基础到高级的三级架构设计、威胁情报体系构建、日志分析与关联技术、标准化事件响应流程(NIST五阶段),以及SOAR自动化编排实践。强调从被动响应向主动防御转型,通过技术平台集成、流程标准化和自动化编排,实现7x24小时持续监控、快速威胁检测和协同响应能力,最终建立可度量、可改进的安全运营体系。
2025-10-15 19:35:26
1334
原创 数据安全指南-合规治理 2025 等保2.0测评实施 全球数据保护法规对比 数据分类分级管理 ISO27001与SOC2认证 跨境数据传输合规
本文系统梳理全球数据保护法规体系(GDPR/CCPA/PIPL核心原则与域外效力对比)、行业认证标准(ISO27001、SOC2、PCI DSS实施要点)、数据分类分级实践(国标GB/T35273与行业案例)、中国等保2.0制度(五级划分、测评流程、云计算扩展要求)及数据出境管理(安全评估、标准合同、专业认证三条路径)。详解CIIO判定、触发条件、风险自评估及SCCs、数据本地化趋势,为企业构建合规框架提供操作指南。
2025-10-15 19:32:22
1947
原创 数据安全指南-理论基础与技术体系 2025
本文全面阐述现代数据安全体系,涵盖数据全生命周期保护(采集、存储、使用、共享、销毁)、核心技术实践(AES/RSA加密、RBAC/ABAC访问控制、动态脱敏、密钥管理KMS、DLP防泄漏)及现代架构(零信任、纵深防御、数据中心化)。详解从被动响应到AI智能治理的四阶段演进,强调隐私计算、差分隐私等前沿技术在GDPR/PIPL合规场景的应用,为企业构建数据安全防护体系提供实战指南。
2025-10-15 19:28:32
1119
原创 数据安全工具手册——便捷实用的安全工具集-20251014
本文分类整理了数据安全领域的各类工具,涵盖加密密钥管理、数据脱敏、防泄漏、数据库安全和访问控制五大场景。主要包括开源和商业工具,如VeraCrypt、HashiCorp Vault等加密工具,Faker、OpenDP等脱敏工具,Symantec DLP、Google Cloud DLP等防泄漏方案,以及Imperva、Okta等数据库和身份管理工具。每个工具标注了类型、功能和技术栈,方便按业务需求快速查阅选用。
2025-10-14 21:23:32
1010
原创 《通用智能体必然包含世界模型》《General agents contain world models》论文深度解读
论文证明的不是:“世界模型有用”(这是共识),而是证明了:“通用智能体不可能不学习世界模型——这是泛化能力的信息论必然性,就像热力学第二定律对能量系统的约束一样不可违背。”这终结了AI领域长达30年的"model-free捷径"幻想,把争论从"选择哪种范式"变为"如何最好地学习和利用世界模型"。
2025-10-13 19:50:32
1204
原创 《早期经验:语言智能体学习的中间道路》Agent Learning via Early Experience论文深度解读
论文提出"早期经验"作为模仿学习和强化学习之间的桥梁,解决了当前AI智能体训练的两难困境:既不依赖昂贵的专家数据,也不需要难以获取的奖励信号。2. 双路径方法隐式世界建模:让智能体预测自己动作的后果自我反思:让智能体理解为什么某些动作更好
2025-10-13 19:37:21
888
原创 大模型的脆弱性:攻击向量与防御策略( 提示词注入、越狱、提示词泄漏、对抗性样本、数据/模型中毒、资源耗尽攻击、幻觉操纵)
本文从安全研究视角剖析了大语言模型(LLM)的脆弱性及其防御策略。文章首先揭示了大模型的本质局限——基于统计模式匹配而非真实理解,导致容易受到攻击。随后系统梳理了七种主要攻击向量,包括提示词注入、越狱、数据中毒等,并分析了各自的技术机理。在防御层面,提出了多层次安全架构,涵盖输入检测、特权分离、对抗训练等关键技术。最后通过Bing Chat越狱等真实案例,验证了攻防对抗的复杂性。文章强调,AI安全需要开发者、用户多方协同,构建深度防御体系。
2025-10-11 14:44:19
1043
配套文件:知识图谱入门-7:阶段案例
2024-10-05
2024计算机设计大赛,数据解读乡村发展,数据分析,Jupyter Notebook分析建模,可视化图表
2024-09-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅