自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 可靠性职业路径:Level 2 可靠性工程师,标准应用者的真实画像与进阶法则

熟悉常规失效分析工具:光学显微镜(OM)、X-Ray/CT、C-SAM / SAT、Cross-section、研磨、抛光化学开封(Decap)、SEM、EDS等,知道这些工具大概用来干嘛,对失效分析步骤会给出简单指导(follow SOP);一般会按部就班根据标准进行试验。另外执行过程中,有任何阶段性的(或好的、或不好的)进展都需要与项目组沟通,让进展“透明化”。工具使用:大多使用的可能不太熟练,JMP、Minitab、Weibull ++, 其实实际中应用的人非常少,大多数人还是靠excel进行计算。

2026-06-05 20:23:37 200

原创 竞争失效模式 (CFM) 全解析:如何用“隔离法则”精准算出复杂系统的整体可靠度?

用咋可靠性专业术语来说:这就是对于产品的失效,可能有不同的失效模式(Failure Mode). 那么对于有不同失效模式的分析,就是今天要讨论的。因为这些失效模式对A无影响(B失效的时候A失效并没有发生),所以将这些失效数据当作pass的,即。书中的例子:一个电力系统,两种失效模式:一是电压过载(表示为V),而是磨损疲劳(表示为W)。话说这么多的女孩子,最后和张无忌都分道扬镳,没能走到一起(失效了)。那单独计算某种失效模式的时候,其他失效模式的样品怎么处理?,只要有一种失效,那么系统即失效。

2026-06-03 19:55:07 162

原创 可靠性职业路径:Level 1 实验室技术员/助理工程师,试验执行者的真实画像与破局法则

设备操作:熟练操作各类温箱、振动台、跌落台等,当然所负责试验项目不一样,比如机械、环境、化学类分开,那就熟悉自己负责的(试验所用)设备;基础排障:设备报警时,能区分是产品短路导致的跳闸,还是设备自身的传感器故障(如水压不足、超温报警)。需要保证测试(过程)的真实、准确、安全,不需要为产品设计缺陷背锅。往往缺乏系统性的工程思维训练,容易将这份工作视为“流水线上的打螺丝”,而非“工程研发的一环”。要明白自己在做啥,每天的工作任务,可以清晰的进行安排。按时巡检,如实记录仪表的读数、样品的中间状态。

2026-06-02 20:24:05 167

原创 深度解读AEC- Q:TC后为啥要WBP(Wire Bond Pull)测试?深扒“柯肯达尔空洞”

现在就很好理解为啥TC后再做WBP,就是简单的DPA来check 产品经历市场端一段环境(规定的时间)后其wire bond 性能是否减弱。用金线(Au)通过热超声键合打在硅片的铝焊盘(Al)上,金和铝两种金属原子的晶格被瞬间打碎并互相挤压。随着时间推移,这些微小的晶格空位开始聚集、融合,最终在金线与 IMC 层的交界处,形成了一个个肉眼(借助电镜)可见的微观空洞。在 TC 循环的反复撕扯下(应力疲劳),这些微小的空洞迅速贯穿连成一片,演变成横向的宏观裂纹(Crack)。不同金属原子的扩散速度不同。

2026-05-25 19:42:12 19

原创 深度解读AEC- Q:HAST测试Bias的5大基本要求

此时二极管的势垒拉到了最高(满足了条件d的高电压),但因为是反向截止,通过的仅仅是纳安(nA)级别的反向漏电流。为了以防万一,防止某个内部逻辑路径意外导通引发短路发热,HAST测试板(BIB)上的每一路供电引脚外围,通常都会串联一个几十kΩ甚至上百kΩ的限流电阻(Current Limiting Resistor)。间距小、电压大,加速失效。如果芯片在测试中功耗过大,芯片自身就会产生焦耳热(Self-heating),进而烤干芯片表面的水分,导致局部湿度减小,从而达不到“高湿”的测试目的。

2026-05-25 19:37:43 310

原创 统治工程届的“浴盆曲线”,在今天要失效了?

只要不发生过流过压击穿(随机失效),一颗合格的硅芯片其本征物理寿命(如电迁移、经时层穿击穿TDDB的寿命)往往长达数十年甚至上百年,远远超过了产品本身的商业生命周期(比如一辆车开15年,一部手机用3~5年)。可靠性领域大名鼎鼎的浴盆曲线(Bathtub Curve),每个人刚入行的时候都被灌输这个概念:早期、中期(偶然)和晚期(损耗期)失效。如果分析一架飞机或一个拥有上万个节点的云计算数据中心,会发现一个极其诡异的现象:整个系统的失效率随时间推移,几乎是一条毫无波澜的水平直线。2. 电子元器件的指数分布。

2026-05-23 21:19:05 17

原创 白话蒙特卡罗方法与其JMP实战模拟

最坏情况(Worst-Case)下:PCB焊盘小到了极限(0.95),同时连接器引脚大到了极限(1.05),贴片机又偏到了极限(-0.03),这就装不下去啊。Step:新建JMP 数据表 —>新建三列:命名为 V, R, 和 Power—>右击列名P —> 公式 (Formula) —> 输入公式(V^2 / R) (V 和 R 列不用填任何数据,让电脑随机生成N万个数据。传统方法:排列组合,各抛一次的结果一共有36种,其中等于7(1+6,2+5,3+4,4+3,5+2,6+1)有6种。

2026-05-22 20:44:40 302

原创 有的公司一个可靠性工程师都没有,还一年赚几个亿,可靠性真的没前途吗?

给出来的产品早就经历各种各样的验证,对于下游组装厂来说,不乱改设计,做好基础的进料检验(IQC)和产线成品质量控制(QC),产品大概率就不会出大错。所以,要最好的、最贵的。比如花了20块钱买了个耳机,买的时候心里就想这肯定是个“崴货”,用了不到半年,果然坏了,证明自己是对的。今天群里讨论,有个公司营收非常高,利润非常可观,但是公司别说可靠性部门了,之前连一个可靠性工程师都没有,但人家不过的好好的?顶级的可靠性团队,把不良率从压到很低的 PPM,产品”用不坏“,对公司来说是极其划算的投资。

2026-05-21 20:34:12 180

原创 芯片失效机理 — 热载流子注入/HCI(Hot Carrier Injection)(概念、机制、预防及退化模型)

衬底中的电子被耗尽区的电场拉出并加速向沟道运动,当电场足够高时,这些电子就有了足够的能量可以到达Si-SiO2 界面,并注入到SiO2中。而在更先进的GAA全环绕栅极晶体管中,纳米片间存在应力耦合现象,电场畸变会使得热载流子的注入路径难以预测,加剧退化的随机性。发生在漏极边缘的强电场中,由雪崩倍增产生的空穴和电子注入引起,载流子在漏极区域的高电场作用下获得能量。此外,部分生成的载流子还会导致体电流。当Vg和Vd 均高于源端电压时,沟道内的载流子会在横向电场及纵向电场的共同作用下,进入栅氧化层形成界面态。

2026-05-20 19:48:18 371

原创 对一般企业, 可靠性分配是伪命题?

而一般企业所需要的最后层级的产品大多是外购,这个时候只能在市场上现有的、成本允许的元器件中进行选择。他们有充足的时间和数以亿计的预算,去支撑庞大的可靠性团队做复杂的数学建模、分配计算以及后续的海量测试。根据8020 法则,90%的失效可能都是由于10%的原因导致的(可能更夸张),很多企业有了一定经验后也大致知道自家产品的薄弱点在哪里;都靠供应商的规格书吗?对于一般企业,“可靠性是设计出来的,是测试出来的,但绝不是分配出来的。所以,分配到最后,RE管理的就是那一颗颗的电阻电容,那一个个轴承螺丝的可靠性。

2026-05-18 20:22:20 204

原创 作可靠性必看的82本书,从理论到实践

图解入门 半导体器件缺陷与失效分析技术精讲。可靠性工程教材之四失效模式影响及其后果分析。基于退化的可靠性技术:模型、方法及应用。概率论与数理统计第二版课后习题参考答案。可靠性工程教材之一系统可靠性的数学基础。深入浅出数据分析(中文版)《可靠性数据的收集与分析》可靠性维修性保障性工程基础。可靠性维修性保障性要求论证。关键基础设施风险相互依赖性。美国可靠性工程师认证手册。可靠性工程师必备知识手册。环境与可靠性试验应用技术。汽车与机械工程中的可靠性。可靠性数据处理与寿命评估。电子元器件使用可靠性保证。

2026-05-17 16:04:58 194

原创 深度探讨:通过AEC-Q100的“3批次77颗”零失效标准,为什么市场端还是有很多的失效?

当时定下 231 颗(LTPD=1%)的抽样,是指望同时拦截“系统性本征失效”和“1%量级的随机早期失效”。在晶圆制造(Fab)和封装(ATMP)的量产过程中,外在的随机缺陷(灰尘、掺杂浓度不均、划痕)等才是导致其失效的根本原因。这张图就非常经典,对于一些参数,比如有USL和LSL,如果测试值没有超过spec,那么意味着这个参数是pass的,合格的,没有问题。1%的失效,是多少PPM?但是对于上边这个图,对于两个红虚线之外,LSL和USL之内的测试值,这些值距离整体有一些距离,但是并没有fail。

2026-05-16 19:21:42 296

原创 HAST vs THB:在Chiplet时代,为什么HAST成了掩盖芯片腐蚀的“凶手”?

在湿度环境下,一旦水汽渗透进底部填充胶(Underfill)或塑封料的微小缝隙,ECM就会发生:铜离子在电场(Bias)的作用下,从阳极向阴极游离,最终生长出树枝状的金属结晶(Dendrite),导致相邻引脚直接短路。在85℃(THB)下,铜表面的氧化非常缓慢,伴随着液态水的存在,铜容易被氧化成可溶性的铜离子(Cu2+),随之发生电化学迁移,导致短路失效。没有液态水,电化学腐蚀(ECM)的通道被切断。在THB(85℃)中大批量失效(腐蚀)的先进封装芯片,居然可以通过更严苛的HAST(130℃)测试!

2026-05-16 19:17:45 311

原创 搞可靠性就是浪费钱?

对于工业设备(比如停在海外矿山的挖掘机,或医院的CT机),单次维修的跨国差旅和停机损失,可能超过当年为了省钱而用的廉价芯片省下的所有差价。在一个竞争惨烈的市场中,投资于研发早期的可靠性工程(DfR、PoF、HALT),是企业在全生命周期中获得最高投资回报率(ROI)、斩获最大净利润的最强商业武器。所以需要买更贵(耐高温)的电容、更厚的 PCB 板、要求增加冗余的传感器。可靠性工程师在实验室里“浪费”的那些钱,本质上就是用前期的“1块钱”,去精准排雷,消灭未来那“10,000块钱”爆炸的可能。

2026-05-15 20:14:02 177

原创 灵魂拷问:为什么AEC-Q的HTSL/PTC只要45颗 * 1Lot,其他测试却需要77颗 * 3Lots?

只要物料不换,不管张三还是李四哪天生产的批次,在 150℃ 烤箱里烤 1000 小时的降解速率几乎是一模一样的。于是又来了3次,每次4个菜(4 x 3 Lots),然后我们发现后边这3次有两次的菜没有之前的好吃。JEDEC 面对的全球代工厂良莠不齐,它假设有些封装厂的工艺管控极差,哪怕是纯烤箱测试也可能因为某天烘烤炉温度不均导致批次差异。看,这里在99%可靠度,0 Fail,0.949可靠度下,需要的样品数量是45 = 15 * 3 Lots。第一步:算出“总的样品量” ,其决定我们对缺陷的容忍底线。

2026-05-15 20:09:41 367

原创 工程师的“时间机器”:秒懂活化能(Ea)与产品寿命预测的底层逻辑

过渡态理论(过山车):化学反应不是“碰一下就变产物”,而是经过一个由反应物分子以一定构型存在的中间过渡态,形成这个过渡态需要一定的活化能。我们需要一股爆发力,跨过那个“啊,不想起”的坎。常见不同失效机理下的活化能,需要注意的是活化能由其对应的失效机理决定,而不是由材料决定,相同的材料在不同的失效模式下,其活化能也可能不一样!任何反应(无论是木头燃烧、金属生锈,还是电池老化),要想发生,分子们都必须先跨过一道无形的“能量屏障”。T(温度):温度越高,分子的整体动能越大,跨过这道坎的概率就呈“指数级”飙升!

2026-05-14 20:17:35 181

原创 深度解读 AEC-Q100 Rev-J:为什么先进制程芯片的 ESD 电压降低?车规标准“放水”了?

但你依然需要把这个情况如实告知 Tier 1 或主机厂,只有客户(User)签字认可(Approval)“1000V 在我的系统设计里是安全的”。如果强行设计一个在 2000V 高压下能保护如此脆弱的晶体管、同时又不能有太大寄生电容的 ESD 电路,在现有的半导体物理框架下,几乎是个“不可能的三角”。即针对 28nm 及更先进的工艺节点,或者射频芯片,AEC将 HBM 的目标值从 2000V 降到了 1000V,CDM 也降低到之前的一半甚至1/3.但在(如今)算力时代,芯片与之前相比有点“娇弱”。

2026-05-14 19:49:42 288

原创 从机械到电子,一文盘点产品常见的15大退化机理

概述: 在电场和水分的共同作用下,金属离子从阳极游向阴极并沉积,长出像树枝一样的导电结晶,最终跨越绝缘区导致短路。概述: 由于不同材料的“热膨胀系数”不同,在温度剧烈变化时,材料拼接处会产生巨大的拉扯力(剪切应力),导致开裂。概述: 材料受到反复的机械加载和卸载(比如持续的振动),最终将会发⽣疲劳失效(反复弯折一根铁丝,最终会断裂)。概述: 微小的缺陷在应力作用下逐渐变大,最终导致材料断裂(focus on 裂纹的萌生和扩展)。主要发生在金属、塑料、陶瓷等基础材料(经典、研究最成熟的退化机理)。

2026-05-13 18:51:33 308

原创 什么是极大似然估计/Likelihood、AICc 与 BIC,这是我听过最好的回答【可靠性应用干货】

当你的样本量(数据行数)相对较小,或者模型参数较多时,普通的 AIC 容易误导你选择过于复杂的模型。仍以阿超的冰淇淋为例,假设阿花对阿超有好感的概率为p,则无感的概率为1-p(假设每次都是独立同分布),则根据阿超得到0个冰淇淋其概率为P(0个冰淇淋 | Model), 将第一次结果记为P1,第二次为P2,。与 AICc 的区别(惩罚力度更大): BIC 在计算“惩罚项”时,不仅考虑了参数的数量,还把样本量的对数计算在内。原理:在随机试验中,许多事件都有可能发生,概率大的事件发生的概率也大。

2026-05-12 19:50:15 370

原创 什么是置信区间,这是我听过最透彻的工程学解释

通过有限的几个样本(比如 5 台样机),套用数学公式(如最大似然估计 MLE 或中位秩),算出来的一个唯一的、确定的数值(比如 MTBF = 12000 小时,或者威布尔形状参数β=2.5)。既然永远无法确切知道“真实的总体寿命”是多少,就不能只给出一个孤立的数字:需要给出一个“范围(区间)”,并标明我们对这个范围有多大的把握,这个把握就是置信度(简单理解就是信心,有信心的程度)。置信下限的价值:做出了最坏的打算。这种偶然(随机)得出来的结果,当成所有产品真实分布的定义,是“盲目的自信”。

2026-05-10 09:28:52 333

原创 振动筛选:为什么不找到产品共振频率后进行正弦振动?

但在复杂的机械干涉(比如排线和外壳的互相摩擦、屏蔽罩和电池的微小间隙碰撞)中,这些最致命的潜在缺陷,主板的共振频率可能是150Hz,但摄像头马达的共振频率可能是1200Hz,排线(FPC)的共振频率可能是450Hz。在量产中,由于材料、工艺偏差(如螺丝拧得不紧、贴片的元器件重量公差,产品的真实共振频率都是在一定范围内随机漂移的。如果根据实验室的扫频结果,把振动频率固定在所谓的“共振”频率,对于相当一部分产品来说,这个频率无法引发共振。这么短的振动应力,根本不足以让这些零件积累足够的疲劳损伤,缺陷被放掉。

2026-05-07 09:14:15 35

原创 统治工程届的“浴盆曲线”,在今天要失效了?

浴盆曲线在可靠性工程中的适用性正面临挑战。随着生产工艺优化(如六西格玛、SMT技术)大幅降低早期失效,电子元器件的长寿命特性使耗损失效在产品生命周期内难以显现。复杂系统由于组件更新和混合寿命分布,整体失效率趋于稳定,呈现泊松过程特征。传统浴盆曲线正被新的寿命分布模型所替代,反映出技术进步对可靠性理论的深刻影响。

2026-05-06 15:34:02 18

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除