第331章 天权4号的可靠性长周期测试(1 / 2)
芯谷地下二层的验证中心,在这座建筑里是一个特殊的存在。它不像研究院那样窗明几净,也不像追光厂房那样充满工业感。这里的走廊只有一米二宽,天花板上的灯管每隔一根就拆掉了一根,照度刻意保持在偏暗的水平——不是因为省电,而是因为亮度过高会影响某些光学检测设备的精度。
走廊两侧是一扇扇厚重的金属门,每扇门后面都是一个独立的环境测试舱。这些测试舱是两年前天权3号流片时建的,当时只有六个,现在扩展到了十八个,占据了地下二层将近一半的面积。每个测试舱都可以独立控制温度丶湿度丶气压丶振动频率和电磁辐射强度,模拟从北极圈到热带雨林丶从海平面到高原丶从实验室到发动机舱的各种极端环境。
章宸站在六号测试舱的观察窗前,手里拿着一个平板,屏幕上显示着天权4号在过去七十二小时里的全部测试数据。他穿着一件深灰色的工装外套,口袋里插着三支不同颜色的马克笔,胸前的工牌背面写满了今天要确认的测试项。
(请记住 读台湾小说选台湾小说网,??????????.??????超流畅 网站,观看最快的章节更新)
六号测试舱里,一块天权4号的工程验证板被固定在振动台上。验证板上有十二颗晶片,每一颗都连接着独立的电源监控丶温度传感器和功能安全监测电路。振动台以每分钟三千次的频率丶三个方向同时施加随机振动,模拟的是汽车发动机舱在颠簸路面上的工况。验证板旁边的温控箱显示实时温度:零下四十度,湿度百分之八十五。
这个测试条件,比车规级标准要求的最严苛工况还要高出百分之二十。
章宸不是个喜欢「加码」的人。但天权4号的情况特殊——它是因为NPU调度器效率问题回退RTL丶流片延迟五周的晶片。延迟的五周被用在了修改和验证上,但修改后的设计能不能在真实环境中稳定运行,不是仿真能完全回答的。所以他在测试大纲里加了三组比标准更严苛的条件:更宽的温度范围丶更长的测试周期丶更复杂的复合应力组合。
「七十二小时,零故障。」站在他旁边的测试工程师老葛说,语气里带着一种小心翼翼的乐观。「十二颗晶片,七十二小时,每颗晶片跑了两百四十万个测试向量,没有发现任何功能错误。温度循环丶振动丶电压拉偏丶时钟抖动注入,全部通过。」
章宸没有接话,而是用手指在平板上滑动,调出了每一颗晶片的温度曲线。十二根曲线在七十二小时的时间轴上几乎完全重合——最高温度六十二度,最低温度零下四十度,温度变化率每秒钟十五度。在这么剧烈的温度冲击下,晶片内部不同材料的热膨胀系数差异会导致微米级的形变,长期累积可能造成焊点疲劳丶封装开裂丶甚至晶片和基板之间的连接断裂。
天权4号的封装团队在流片前做过仿真,理论寿命是两千次温度循环。但章宸知道,仿真和实测之间有一道鸿沟。这道鸿沟的名字叫「现实」。
「温度循环还要跑多久?」他问。
「计划是跑一千次,现在跑了三百二十次。按目前的进度,还需要大概五天。」老葛调出测试计划,「但有一个问题——七号舱的温控系统昨天下午出了点异常,温度过冲超过了设定值三度,持续时间大概两秒。虽然很快恢复了,但按照测试规程,那批晶片的测试数据需要标记为『有异常干扰』,不能作为有效数据。」
章宸皱眉:「七号舱里跑的是什么?」
「天权4号的另一组工程样片,十二颗,跑的是高温高湿加速寿命测试。温控系统异常发生在测试开始的第十七个小时,之后我们重启了测试,但已经跑的那十七个小时的数据不能用了,要重新跑。」
「异常原因查清楚了吗?」
老葛调出了七号舱的温控系统日志:「温控系统的PID控制器参数漂移了。这台设备用了三年,PID参数是出厂时设定的,没有做过自适应校准。温度过冲的原因是控制器的积分项累积误差过大,导致输出超调。」
章宸在平板上记下了这个问题,然后走到七号舱的观察窗前。里面的测试已经重新开始了,十二颗晶片正在八十五度丶百分之八十五湿度的环境下运行。这个测试条件模拟的是热带地区高温高湿环境下的长期可靠性,通常跑一千个小时相当于设备在真实环境中使用三年。
「所有测试舱的温控系统,今天之内全部做一次PID参数校准。老化的设备标记出来,排进更换计划。」章宸说,语气不是责备,而是陈述一个必须完成的任务。「天权4号的可靠性测试不能因为设备问题中断或失真。如果设备不行,就换设备;如果设备要修,就等修好了再跑。测试周期可以延长,但数据必须可信。」
老葛把任务记下来,然后问了一个章宸已经在想的问题:「测试周期延长了,天权4号的量产时间表要不要调整?」
章宸没有立刻回答。他走到地下二层的中央监控室,这里有一整面墙的屏幕,显示着十八个测试舱的实时状态。六号舱的振动台还在震动,七号舱的温控曲线稳定爬升,九号舱在跑电磁兼容测试,十一号舱在跑电源瞬态响应。每一块屏幕上都有数字在跳动——温度丶湿度丶电压丶电流丶频率丶误码率丶错误计数。
天权4号的量产时间表,是两个月前就定下来的。流片延迟五周已经让天衡5的量产计划承受了巨大压力,如果可靠性测试再延期,整条产品线都会受影响。但章宸更清楚一件事:晶片量产最怕的不是延期,而是带着隐藏问题上线。隐藏问题会在用户手里爆发,到那时,损失的不是时间,是信任。
「时间表先不调。」他说,「我们先把能并行的事情并行。可靠性测试继续跑,量产准备工作同步推进。等测试数据出来,如果有问题,再决定要不要延期。」
老葛点了点头。
章宸在监控室坐了半个小时,看着每一块屏幕上的数字。十八个测试舱,两百一十六颗天权4号工程样片,正在同时经历着高温丶低温丶高湿丶振动丶电磁干扰丶电压波动丶时钟抖动的轮番考验。这些考验是残酷的,但晶片的设计目标就是在残酷中保持稳定。
他想起林薇在追光设备国产化会议上说的那句话——「晶片是承诺,不是妥协。」
天权4号的承诺,就是在零下四十度到零上八十五度的温度范围内丶在百分之五到百分之九十五的湿度范围内丶在每秒三千次的振动下丶在几十伏每米的电磁场中,依然能正确地执行每一条指令,依然能稳定地输出每一个计算结果。
这个承诺,过去七十二小时里,两百一十六颗晶片全部兑现了。
但七十二小时不够。章宸要的是两千个小时丶一万个小时丶十万个小时。他要的是天权4号在真实世界中被用户用三年丶五年丶七年之后,依然能兑现这个承诺。
下午,赵静来了。
她不是来参加测试的,而是来送小芯对天权4号测试数据的分析结果。悟道算力平台的负载调优和天程车规晶片的样车集成占用了她大部分时间,但章宸一周前就请她帮忙跑一组分析——用小芯的异常模式识别能力,在天权4号的测试数据里找那些人类工程师可能会忽略的微小异常。
「小芯在温度循环测试的数据里找到了一个模式。」赵静把分析报告递给章宸,然后走到监控墙前,指着六号舱的数据曲线。「你看这十二颗晶片的温度曲线,表面上看完全重合,但如果把温度变化率放大一百倍,就能看到差异。」
她调出了小芯的分析结果——一张放大后的曲线图。十二根曲线在温度变化的拐点处出现了微小的分离,有的晶片温度上升得快一点,有的慢一点,差异在零点零几度的量级。
「这不是问题。」章宸说。
「单独看不是问题。但小芯把这种微小差异和另一组数据关联起来后,发现了一个规律。」赵静调出了第二张图,是这些晶片的电源纹波数据。「温度上升快的晶片,电源纹波也稍微大一点。纹波大的晶片,功能安全监测电路的自检周期会稍微长一点。所有差异都在规格范围内,但它们之间存在相关性。」
章宸盯着那几张图看了很久。
「小芯的判断是什么?」
「不是故障,是特徵。这些晶片的物理特性存在细微差异,导致它们在温度响应丶电源纹波丶自检周期上表现出不同的特徵。这些特徵在规格范围内,不会影响功能和可靠性。但小芯发现,这些特徵和晶片在晶圆上的位置有强相关性——晶圆边缘的晶片和中心的晶片,表现不一样。」
章宸明白了赵静的意思。
这不是一个需要修复的问题,而是一个需要被理解的现象。天权4号的晶片从晶圆上切下来的时候,因为晶圆制造过程中的工艺偏差,边缘和中心的晶片确实会有细微差异。这些差异在设计阶段就被考虑到了,规格范围也覆盖了这些差异。但小芯的分析提供了一个新的视角——这些差异不是随机的,而是有规律的,可以被预测丶被分类丶被用于更精细的筛选。
「这个分析结果,我要用到天权5的设计里。」章宸说,「晶圆边缘和中心的差异,我们之前在设计余量里已经覆盖了,但没有做针对性的优化。天权5可以在版图设计阶段就把这种差异考虑进去,让边缘的晶片和中心的晶片在关键参数上更一致。」
赵静把这句话记了下来,然后问了一个更实际的问题:「天权4号的这批工程样片,按现在的测试数据看,能进入小批量试产吗?」
章宸沉默了几秒。
「能。但不是因为测试数据完美,而是因为我们知道所有不完美的地方在哪里,知道它们的影响范围,知道怎么在量产测试中把它们筛出来。晶片量产不是追求每一颗都一样,而是追求每一颗都在规格范围内,并且我们知道每一颗在规格范围内的具体位置。」
赵静点了点头,离开了监控室。
章宸一个人坐在监控室里,继续看那些屏幕。
下午四点,方程来了。
方程不是来参加测试的,他是来问一个问题的。天罡生态的商业化服务试点需要跑在天权晶片上,方程需要知道天权4号的可靠性数据,才能确定商业化服务的SLA——服务等级协议。如果晶片的可靠性不够,天罡生态就不敢承诺百分之九十九点九的可用性。
章宸把今天的测试数据调出来,一页一页地给方程看。
「七十二小时,两百一十六颗晶片,零功能故障。温度循环丶振动丶高湿丶电磁兼容丶电源瞬态,所有测试项都通过了。但这不是最终结论,可靠性测试要跑完完整周期才能下结论。」
方程看着那些数据,问了一个章宸没想到的问题。
「天权4号和天权3号比,可靠性是提升了还是下降了?」
章宸调出了天权3号在同样测试条件下的历史数据。两张表并排放在屏幕上,对比一目了然。天权4号的温度循环寿命预期比天权3号高了百分之四十,电源纹波低了百分之三十,功能安全诊断覆盖度从百分之九十七点二提升到了百分之九十九点一。
「提升了。」章宸说,「不是因为天权3号做得不好,而是因为天权4号在设计阶段就把天权3号在可靠性测试中暴露的所有问题都解决了。NPU调度器的修改不只是解决了效率问题,也顺便优化了电源管理和热管理,所以可靠性反而比预期更好。」
方程在笔记本上写了几个数字,然后抬头看着章宸。
↑返回顶部↑