芯片制造中越来越多的数据问题

来源:众壹云 发布日期:2021-09-01 09:23

对于芯片生产管理系统,古老的计算格言“garbage in/garbage out”仍然适用。对于清理数据仍然是一项辛苦的工作。

随着半导体供应链中数据价值的增加,现在基本上有两条供应链并行运行。一个涉及正在创建的物理产品,而另一个包括与每个流程步骤和制造设施相关的数据。为了更好的芯片生产制造,芯片制造商需要对两者进行严格管理。

在晶圆、组装和测试制造设施中,数据可以在产品测试程序、步骤和设施之间保持一致。完成后,可以通过数据管理基础架构中的检查、修复和警报来管理这种一致性。每当数据看起来有问题时,系统就会对其进行保留,以便工程师对其进行检查并确定原因。

数据整理——获取干净的数据进行分析——对于希望从半导体数据中提取信息的工程师或数据科学家来说可能是一个巨大的时间消耗。在某些情况下,它可以占用他们 80% 到 90% 的时间。近二十年来一直在努力简化这一过程。最初的目标是制造过程的前端,但最近注意力已经转移到晶圆测试、组装和最终测试的后端。

后端仍然是半导体数据分析中最不为人所知的领域,这在很大程度上是因为它是涉及数据生成器的乏味工作。对于数据科学家来说,令人兴奋的事情涉及基于数据的分析、自适应流和预测模型。

PDF Solutions Exensio 解决方案总监 Greg Prewitt 表示:“人们不太了解的是整个供应链中数据对齐的复杂性和解决方法。” “设备和相应数据的谱系对于复杂 ML 模型的训练很重要。复杂性包括在不同步骤使用不同的标识符,以及反向 BOM(物料清单,一个单元到多个设备),然后是 BOM(多个设备到一个单元)。”

最大的挑战之一涉及测试和组装设备存储数据方式的差异。“在 Advantest 具有良好可见性的后端流程中,从一次插入到另一次插入的数据可能具有不同的格式,因此很难跨其他插入使用,” Advantest America技术和战略副总裁 Keith Schaub 说。“我们正在做的最重要的事情是使数据能够在多个测试插入中使用,并最终在整个测试生命周期中使用。”

其他人报告说看到了同样的问题。“只是缺乏用于测试单元和测试程序数据的通用数据格式,” proteanTecs产品营销副总裁 Shai Eisen 说。“如果该行业趋同于共同的结构,这将有所帮助。数据还存在技术限制。仅仅是数据的解析、翻译和扩充,以及数据的清理,都非常耗费资源和时间。这不仅仅是关于一个通用的数据结构。这就是你阅读的内容,你如何阅读和存储它,你如何格式化它以及你如何使用它。”

如今,工程团队正在花费大量精力来调整和修复后端产生的制造数据。虽然这不是技术障碍,但做错了会导致数据无法使用。这是 IT 世界中主数据概念背后的推动力,该概念旨在处理企业级业务系统中的孤立和不一致的数据。该过程包括确定特定类型信息的主要来源、分配相关数据的责任方以及建立数据维护程序。

为什么测试和组装数据不一致事实证明,将这一概念应用于半导体制造更加困难。

Onto Innovation软件产品管理总监 Mike McIntyre 表示:“目前有两个主要驱动因素破坏了半导体制造领域中数据的桥接和对齐。“第一种情况是材料或材料的某些组成部分在公司之间转移。当自动化不足以支持设备及其数据生成和收集需求时,主数据实践的第二次突破就会发生。”

从无图案晶圆到最终封装单元之间实际上有数百个工艺步骤。其中每一个本身都很复杂,这使得管理数据成为一项艰巨的任务。最重要的是,代工模式在设计和制造过程之间设置了界限。虽然 IDM 在某些领域可能具有优势,但他们也会外包一些制造步骤。

更令人困惑的是,工厂在命名约定和操作实践上有所不同。有时这种情况存在于同一家公司内,这个问题经常因重复收购而变得更糟。

Fabless/Foundry 数据

图 1:2017 年 Fabless/Foundry 数据供应链 来源:Global Foundries

更多问题源于生成测试程序的遗留设备。出于多种原因,在较旧的组装和测试设施中对齐数据比在晶圆探针中更难。首先,他们有更多的材料需要跟踪。其次,后端操作在整个物料流中的步骤更加多样化,因此在数据正确性、清洁度和对齐方面出现问题的机会更多。第三,遗留设备和工厂自动化程度较低导致了所有这些问题。

由于其业务性质,高混合/低容量设施在数据对齐方面面临更多挑战,因为产品与产品之间的数据一致性较低。每个产品都有一个由不同工程师编写的独特测试程序,并且通常在测试单元设置、ATE、负载板和处理程序方面有所不同。一天之内,单个测试单元站点可能会更改三到四次。

不一致的数据会阻碍产量工程师对整个供应链的分析。它还阻碍了产品工程师使用自适应测试流程的能力。

“我们如何识别数据库密钥以正确链接和关联从一个流程到下一个流程的数据?尽管软件公司进行了营销炒作,但这很少是简单的做法,” Galaxy Semiconductor首席执行官韦斯史密斯说。“了解在哪些机器上加工哪些产品对应哪些过程数据是一项艰巨的任务。通常,唯一可用于链接数据的关键是时间戳。”

梳理数据是乏味的没有人可以避免纠正数据梳理问题的乏味工作。它要求不同的利益相关者共处一室。这种努力可以用几周或几个月来衡量。

“在很多情况下,这些人不在同一个部门,甚至不在同一个办公室,”麦金太尔说。“首先要有调整数据的目标或目标也很重要。在最好的情况下,一个充满错位的工厂可以在几周内得到解决。在某些情况下,需要几个月或几个季度才能解决。”

有计划地梳理通常需要更多的前期工作。NI研究员Michael Schuldenfrei与一位主要客户分享了早期的数据梳理练习:“从某个日期开始,他们实际上为所有新产品制定了一套说明,以确保数据得到一致记录。我们在逐个字段的基础上与他们坐在一起,并设置规则以捕获超出可接受格式或相关查找范围之外的每个可能的变化值。”

尽管有新的授权,但这些数据并不总是符合所需级别的一致性。这导致产品组对现有的已发布测试程序进行了更改。“这是一个非常乏味的问题,因为你在游戏中发现它太晚了,”Schuldenfrei 说。“最终,他们开始以开发测试程序的方式集成流程,以确保在发布测试程序时,它已经符合数据记录规则。”

搁置数据文件收益管理系统增加了管理客户主数据的自动化。如前所述,在对每个字段中的有效数据进行编码并检查是否已发送正确文件方面进行了大量投资。当数据不正确时,会触发警报。

一旦完成基本的初始工作,绝大多数对齐就可以通过自动化进行监测和控制。尽管如此,当您拥有一家在供应链中有多个分包商的无晶圆厂公司时,设置它并不简单。找出所有错位以及这些错位发生的原因需要时间。

Synopsys硅生命周期管理分析总监 Paul Simon 表示:“通常,对于大客户(数百万晶圆、数百种产品),我们需要大约两个月的时间来完成这个学习过程。. “然后我们有非常干净的数据,只有大约 0.5% 的数据被搁置,我们可以手动处理。在我们的 YMS 平台中,我们有一个客户看不到的数据集成平台。它清理了所有数据问题。对于我们设置的每个产品,在数据进入数据库之前,我们都会检查完整性和准确性。如果出现问题,数据集成平台会自动修复数据。如果我们无法自动修复它,那么该数据将被搁置。工程师试图确定数据问题的根本原因,然后更新数据和配方以反映应如何处理此特定数据问题。”

Simon 指出,在此学习过程中,工程师可以找到不良数据的根本原因,并将其发送回数据供应商,以便他们进行修复。这可能包括输入错误的批号、接收错误或不完整的文件以及丢失测试数据。

但由于遗留系统,并非所有数据问题都可以修复,因此工程师不会使用这些数据。在根据制造数据做出决策时,不完整的准确数据胜过完全不准确的数据。

改进数据梳理在工厂测试步骤之间以及制造和产品组之间映射数据属性通常是事后发生的。产品、工厂和 IT 工程组织也可以通过调整数据、业务和运营流程来预先解决这个问题。

材料标识符标准在这里有所帮助。Amkor Technology的 Amkor 自动化团队成员 DeukYong Yun 说:“一个典型的挑战是缺乏通用数据模式来有效协调数据和构建唯一标识符。” “我们正在使用 SEMI 标准。例如,E142 有一个基板映射规范,但它没有定义材料。我们预计该标准将很快更新,以适应现代半导体单元级可追溯性 (ULT) 需求。”

当融合工厂或产品组业务流程(也称为运营实践)时,工程团队需要考虑更精简的流程——更简单、步骤更少。GlobalFoundries 的一位经理分享了他最近在不同工厂之间比较和对齐数据的经验,以及共享 BKM 的自然尝试。

GlobalFoundries应用智能解决方案高级总监 Sunil Narayanan 表示:“您想使用 BKM,但业务流程并不总是相同的。“除非您在很大程度上与基本业务流程保持一致,否则从技术上讲,您只能付出如此多的努力来标准化事物。”

数据梳理提供了在自动化之前进行简化或进行自动化改进的机会,这很重要。“否则,如果你在标准化之前尝试自动化,你会将问题从业务方面转移到技术方面,”Narayanan 说。“这意味着你需要继续修复它。你增加了要承担的技术债务。”

然而,由于工厂中有多个数据源会产生大量数据——晶圆厂每天产生 PB 级数据——您如何首先确定主数据问题在哪里?

“在过去的几年里,我们把重点放在主数据管理上,”他说。“我们有一个单独的组织结构图,但是当数据量如此之大时,仅靠一个组织是无法解决这个问题的。我们的数据分散在多个域和各种数据存储系统中。一个单一的组织无法应对我们的 MDM 挑战,除非他们有工具向他们展示问题出在哪里,哪里出了问题?我们有一项名为数据编目的重大举措。通过利用技术,我们正在尝试自动化许多可以清楚显示数据沿袭、数据来源、数据注入发生位置以及数据结束位置的事情。”

总结半导体制造行业在主数据管理方面继续取得长足进步,并向需要找出产量偏差、质量问题和设备问题的工程师提供更清晰的数据。仍然存在的挑战更多的是操作性而非技术性。尽管如此,分析和自动化专业人士普遍认为,更多的标准化将有助于该行业。这可能包括测试数据标准、工厂自动化标准,以及更好的工程纪律,以简化操作并就命名法达成一致。这种情况发生得越多,对齐数据的负担就越少。

同时,当无晶圆厂公司或工厂引入良率管理系统(YMS) 时,大大提升了缺陷管理良率分析的效率与准确性,“当您引入系统时,客户开始意识到他们在对齐数据方面存在的问题,”Schuldenfrei 说。“它倾向于将他们推入项目以改善他们的事前一致性。他们开始明白,他们可以做更多的事情,他们可以创造更多的价值,只要他们在作为流程的一部分之前在调整事物方面做更多的工作。”

良率管理系统YMS将缺陷管理良率分析模式由原来YE工程师需要手工采集数据并分析结果改为系统自动实时采集数据并更新分析结果,通过支持主数据系统、数据可视化和预测模型来支持工程团队。如果没有完整、准确和一致的数据,预测模型就无法很好地发挥作用。梳理数据的工作需要主数据管理流程的艰苦侦查工作。