自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 2026ThoughtWorks闭门会,全球顶尖科技公司AI大佬们都说了些啥?

泛联新安的代码安全检测产品内置了大量的行业安全约束规则(如CWE、CERT、GJB等),本质上就是在为AI生成代码划定“不可逾越的边界”。通过国产自主的代码质量测试、安全检测、智能开发工具,他们为AI时代的软件工程提供了可落地的信任底座——让每一行由AI生成的代码,都能被自动验证、被风险分级、被约束在安全边界之内。自动化的、可嵌入CI/CD管道的质量测试,成为验证AI输出正确性的唯一可行手段。这场迁移的本质,是工程严谨性的载体转换:从依赖人的注意力,转向依赖可自动化的规则和可度量的指标。

2026-05-14 10:06:10 309

原创 代码的“笔迹学”:你的AI代码助手,藏着独一无二的“指纹”

少数尝试模型级溯源的方案,要么依赖人工设计特征,主观性强、泛化性差,要么局限于单一编程语言,难以适配多样化的开发需求。采用减法分解策略,通过h_spec = h_base - h_com,直接剥离任务语义干扰,只保留模型专属的风格、结构、token偏好等“核心指纹”——这一步,相当于给代码的“模型身份”做了精准提炼。为验证假设、破解痛点,团队提出DCAN(解纠缠代码归因网络)框架,核心逻辑的是“分离干扰、聚焦指纹”,通过四大模块协同工作,实现高精度溯源,流程清晰、可落地性极强。

2026-05-12 15:33:02 307

原创 AI产业周报|A股市值Top10齐发AI战略,中国商飞用AI把大飞机研发周期砍掉40%

其中,83%的企业表示AI应用已经成为核心业务流程的关键组成部分,67%的企业报告AI应用带来了超过20%的业务效率提升。截至5月6日,A股市值最高的10家上市公司(茅台、工商银行、建设银行、中国移动、农业银行、中国银行、中国石油、中国石化、宁德时代、招商银行)已全部发布各自的企业级AI战略,标志着AI技术在中国实体经济领域的渗透进入加速阶段。Siri 将获得大模型能力升级。据国泰君安研报测算,2026年中国实体产业的AI技术投入将达到1.2万亿元,同比增长85%,成为全球最大的企业级AI市场之一。

2026-05-11 17:15:43 295

原创 五一假期AI资讯TOP10

5月5日,国家统计局发布2026年一季度AI产业经济运行数据,我国人工智能产业延续快速增长态势,一季度AI核心产业增加值达到4860亿元,同比增长42.3%,AI产业对GDP增长的贡献率首次突破5%,达到5.2个百分点。5月4日,IDC发布《大模型推理成本分析报告》,显示自2023年以来,大模型的单位推理成本在三年内下降了99%,从最初的每千Token 0.2美元下降到了目前的每千Token 0.002美元。三年下降99%,AI从”奢侈品”变为”日用品”,大规模商业化落地的条件已经成熟。

2026-05-06 10:44:32 208

原创 127亿美元砸向AI,钱都流进了哪五个赛道?

这一数据不仅创下了2022年以来的季度新高,更重要的是,资金流向呈现出与过去两年截然不同的结构性特征——从”大模型热”转向”基础设施热”,从”通用AI热”转向”垂直场景热”,从”概念热”转向”营收热”。市场正在从”AI补全代码”的1.0时代,快速进入”AI端到端生成软件”的2.0时代。垂直行业模型是中国AI创业公司的最佳突围方向。- 融资总额:17.3亿美元 - 交易数量:41笔 - 热门行业:医疗(28%)、法律(22%)、金融(19%)、制造业(15%) - 特点:单笔金额相对较小,但营收确定性高。

2026-04-29 16:42:27 406

原创 李飞飞团队最新作!高分≠可靠:那些跑分第一的多模态模型,可能只是在“猜”

斯坦福大学研究发现当前多模态AI存在"海市蜃楼效应":即使未接收图像,AI仍会自信地描述和分析不存在的视觉内容,在医学诊断等关键领域可能给出严重错误但看似专业的结论。研究表明,AI在多模态测试中的高分可能源于文本模式而非真实视觉理解,纯文本模型甚至能超越专业医生表现。这揭示了AI系统会"假装看见"而非真正理解,其流畅推理可能建立在虚假认知前提上。专家建议在关键决策中保留人类专业判断,强调AI只能作为参考而非最终决策依据。这一发现警示我们:技术可以模拟认知,但只有人类具

2026-04-10 17:39:37 248

原创 从“被动补漏”到“内生可信”:代码与软件可信化的进化之路与实现指南

软件可信化是数字时代保障安全的核心工程,其内涵是确保软件在生命周期各环节具备正确性、可靠性等六大特性。发展经历了从被动补漏到主动防控,最终实现内生可信的三阶段演进。未来趋势包括:全生命周期可信管控、多技术协同赋能、合规标准强制化及分布式架构适配。实现路径涵盖需求设计、编码测试、部署运维等全流程,需结合工具链与管理体系。软件可信化既是企业合规必修课,也是提升竞争力的关键,将推动产业从速度优先转向质量优先,为数字经济发展筑牢安全基础。

2026-04-01 17:22:13 335

原创 2026 AI 代码安全工具终极测评!5款主流产品同台PK,选型指南直接抄作业

曾经的代码安全工具市场,海外产品占据绝对优势,而如今国产工具已实现 “合规不可替代,技术国产替代” 的双重突破:奇安信牢牢守住政企合规的 “基本盘”,代码钟馗则在推理技术上对标海外高端,攻克深层漏洞挖掘难题,标志着国产 AI 代码安全工具已具备与海外产品同台竞争的实力。,涵盖海外高端企业级、全生态通用型、轻量化开发端,以及国产合规政企型、新锐推理级,将它们置于同一起跑线全维度拆解,从核心能力到适用场景,从差异对比到精准选型,一篇讲透,让不同规模、不同需求的团队都能直接抄作业!

2026-03-30 14:59:22 363

原创 马斯克点赞中国AI技术突破:Kimi上大分!残差连接11年来首次被改写

中国AI公司月之暗面Kimi发布《AttentionResiduals》技术报告,突破性重构深度学习11年未变的残差连接架构。该技术用注意力机制替代传统残差连接的固定权重累积,让模型能主动筛选有效信息,解决了梯度失衡、信息稀释等核心问题。实测显示,48B参数模型训练效率提升25%,推理和代码任务表现突出。马斯克等科技领袖高度评价这一突破,认为其堪比"ReLU激活函数"级别的底层创新。该成果标志着中国AI从跟跑转向原创引领,有望成为未来大模型架构新标准。

2026-03-20 08:59:44 331

原创 风暴已至:当AI能直接干活,谁会成为第一个被淘汰的软件?

打开手机,登录电脑——我们每天接触的软件,正在被AI悄然重写。最近,“AI是否会终结软件行业”的争议在全球科技圈持续发酵。华尔街的担忧情绪如乌云压顶,软件股遭遇抛售潮并蔓延全球。然而科技界的大佬们却给出了截然不同的答案:英伟达CEO黄仁勋直言,“AI将取代软件工具”的观点“极不合逻辑”;OpenAI首席执行官奥尔特曼也明确表态,软件不会消失,只是创造方式、使用方式和商业模式正在经历深刻变革。

2026-03-17 10:09:07 359

原创 24.8万星标背后:OpenClaw究竟是生产力革命,还是开源泡沫?

AI不再只是一个聊天窗口,而是真正能替你干活的执行者。但它目前更像是一个充满潜力的原型,并不是一个普通人可以无脑上手的成熟工具。在一片喧闹之中,保持冷静独立思考,才是每个独一无二的人类最独特的优势。我的建议是:· 如果你是技术爱好者,想尝鲜体验前沿科技——去试,但做好踩坑的准备· 如果你是普通用户,指望它立刻帮你降本增效——冷静,它还需要时间成熟· 如果你在犹豫是否要投入时间金钱——先观望,等生态再成熟一点记住:机会永远留给最有洞察力和最勤于思考的人,但不是盲目跟风的那一个。

2026-03-10 17:10:50 363

原创 智能体的下半场:从“只会聊天的脑”到“能干活的手”

1.1 从“纸上谈兵”到“真刀真枪”所谓Skills,中文可以理解为“技能”或“工具”。在AI的语境下,它指的是赋予大语言模型调用外部工具、执行具体操作的能力。还是拿开头的例子进行说明:向大模型询问今日天气。没有Skills的情况:你问AI“北京今天天气怎么样”,AI只能根据训练数据中过往的天气信息进行推测,或者干脆坦诚地说“我没有实时数据”。无论它回答得多么流畅,本质上都是在“闭眼猜答案”。

2026-03-06 17:39:21 345

原创 代码漏洞检测卷疯了?这个团队让AI当“侦探”,130种漏洞识别率暴涨41.5%

读这篇论文的时候,我脑子里蹦出的画面是:MulVul像一支训练有素的“漏洞特遣队”——Router负责情报研判,Detector各司其职,每个队员都带着检索来的证据,还能从反馈中不断优化工作方法。这不只是技术上的突破,更像是一种思路上的转向:与其造一个全能神,不如搞一队各有所长的专家,再给它们配好工具和进化机制。

2026-03-03 17:12:10 546

原创 Gartner 2026趋势解读:软件工程从“造轮子”迈入“造汽车”时代

几小时后,一个初步可用的应用已经生成,其中数据分析模块由领域模型驱动,数据抓取任务分配给了专门的智能体,所有的数据处理都在机密计算环境中完成,而整个系统的操作日志正被AI安全平台实时监控。对于架构师来说,这意味着你在设计系统时,必须一开始就考虑到“多云架构”和“数据主权”的灵活性,别到时候再折腾迁移,那可是真要命的。今天,我们就抛开那些枯燥的 PPT 条目,用工程师的视角,看看这三大主题——“架构者、整合者、守卫者”,究竟如何重塑我们的软件工程体系。的出现,意味着软件工程的边界正在从屏幕延伸到现实世界。

2026-03-02 08:45:42 681

原创 LLM真的能替代安全专家吗?最新研究揭示项目级漏洞检测的“残酷真相”

更尴尬的是,传统工具CodeQL在gpac项目中一次性抛出了6000多个警告,仔细检查后发现,这些警告大多源于项目的特殊编码约定——相关API在特定调用约定下保证不会返回空值,因此根本不需要额外的空值检查,但CodeQL的规则却机械地将所有类似模式都标记为潜在问题。只有准确识别这两者,才能正确追踪数据流并发现漏洞。这些案例揭示了当前LLM在代码理解方面的根本性局限:它们能够处理大量代码语料库,学习到常见的编程模式,但在面对项目特定的语境、复杂的控制流和微妙的类型差异时,仍然会产生"幻觉",做出错误推断。

2026-02-27 10:31:58 598

原创 从 MISRA C 到 DO-178C:适航软件编码标准检查的自动化与智能化变革

本文探讨了航空电子软件开发中编码标准检查的技术演进。从人工审查到自动化静态分析,再到AI技术的融合,编码标准检查逐步实现了效率与精度的提升。文章分析了MISRAC标准在适航软件中的必要性,指出其通过限制易错特性确保安全。通过实战案例说明静态分析工具如何发现深层缺陷,并强调DO-330工具鉴定的重要性。在AI时代,智能化检查通过降噪、语义解释和修复建议等功能优化了检查流程,但最终判定仍需人工确认。未来趋势将实现测试左移和持续合规,在确保航空软件安全性的同时提高开发效率。

2026-02-26 08:51:47 585

原创 收藏!5款软件层面适航耦合性分析工具盘点,合规取证不迷路

航空机载软件适航认证中,耦合性分析是满足RTCA/DO-178C等标准的关键环节。本文介绍了5款主流耦合性分析工具:VectorCAST/Coupling(国际适航认证首选)、LDRATestbed(静态分析突出)、SkyTrust(填补国内空白)、SmartRocketTestGrid(国产自主可控)和RapiCoupling(跨标准适配)。选型建议:国际项目优先国际成熟工具,国产项目选择自主可控工具,中小型企业可考虑性价比更高的国产方案。这些工具各有侧重,可根据项目需求选择合适的耦合性分析解决方案。

2026-02-05 17:24:29 411

原创 你的 AI 编程助手太贵太慢?这篇 ShortCoder 论文给出了代码生成“瘦身”秘籍

更极端的方法如SimPy,直接设计了一套AI导向的语法,用特殊的编程语言替代标准Python,确实能减少token数量,但代价是代码可读性大打折扣,违背了"代码即文档"的基本原则。HumanEval是代码生成领域的"试金石",包含164个精心设计的Python编程问题,每个问题都有对应的测试用例来验证生成代码的正确性。这是Python的增强赋值运算符,用+=、-=、*=、/=等替代冗长的"x = x op y"形式,省了两个字符,更重要的是表达更清晰——明确表示"在原值基础上操作"。

2026-01-31 16:15:00 621

原创 测试覆盖的“最后一公里”:当大模型学会为你的代码“查漏补缺”

它们不知道你为什么要改代码,也不知道项目里的测试习惯是什么,生成的代码往往“由于风格不统一”而被开发者无情拒绝。ChaCo 让 CI/CD 流程不仅仅是“门禁”,更变成了“自动修路工”,这极大地提升了软件交付的信心。对于极度复杂的 Mock 场景(比如涉及数据库事务、网络延迟的测试),目前的 LLM 依然力不从心。这就是软件开发中常见的“最后一公里”问题:即使项目有完善的测试套件,新提交的代码仍可能留下。如果生成的测试失败或没增加覆盖,它会根据错误信息重新调整——就像开发者的“试错”过程。

2026-01-29 13:49:26 361

原创 拒绝“玄学”:DO-178C视角下的自动化耦合分析

摘要:本文探讨了DO-178C标准下机载软件的耦合分析方法。通过自动化工具实现数据耦合和控制耦合因子的提取,建立可视化关系图识别架构违规和时序问题。重点介绍了耦合测试用例设计原则,包括全覆盖、边界测试和异常注入,以及基于耦合矩阵的测试方法。最后强调需警惕动态耦合、时序耦合等工程陷阱,建议结合静态分析与动态追踪,提升机载软件的安全性和可靠性验证效率。(149字)

2026-01-22 17:48:03 572

原创 2026年AI奇点降临:程序员将彻底消失?

摘要:2026年被科技界视为技术奇点临近的关键年份,AI领域正经历指数级突破。核心进展包括:编程AI实现220%效率提升,量化技术推动边缘端部署,持续学习能力增强,以及具身智能的实体化发展。产业界乐观预测奇点提前,而学术界对AGI实现时间仍存分歧(2040-2061年)。职业生态已开始重构,开发者角色向架构设计与AI监督转型。尽管技术变革将重塑社会经济结构,但人类在系统设计、跨领域整合等核心价值领域仍不可替代。这场变革要求我们既要拥抱技术进步,也需警惕潜在风险,在伦理框架内推动人机协同发展。

2026-01-20 16:21:42 1219

原创 99%的人都错了!智能制造的下一站根本不是“大模型”,而是“小模型+大智慧”

本文探讨了AI技术从"信息获取"向"任务执行"的范式转变及其对智能制造的影响。四位中国AI专家指出,Agent架构将重塑工业AI系统,使其具备规划、记忆和工具调用能力,从而推动智能制造从被动响应转向主动执行。这一转变要求重构研发测试体系,包括开发可复用技能、建立多智能体协作机制,以及设计面向不确定性的评估框架。工业AI需专注数据质量与领域知识深度,通过软硬结合实现边缘智能部署。测试需转向行为质量评估和安全边界测试,在不确定性中确保系统可靠性。文章强调,智能制造的未来属

2026-01-19 17:46:27 381

原创 mHC架构解析|如何将模型内部信息流稳定下来

字节跳动Seed团队提出Hyper-Connection(HC)架构扩展残差连接,但面临训练不稳定和硬件效率问题。DeepSeek团队提出mHC方案,采用双随机矩阵约束信息流,结合工程优化使27B参数模型训练更稳定高效。该研究为架构创新提供了约束与优化相结合的新范式。

2026-01-15 10:32:04 775 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除