汽車產業的任務剖析

英文原文:Mission Profile Analytics For The Automotive Industry

2023年12月12日於《Semiconductor Engineering》刊登

根據現場量測結果,評估電路健康狀態與退化率(degradation rate)

汽車產業如今正在經歷一場重大轉型,電氣化(electrification)、互連性(connectivity)與自動駕駛功能的崛起,推動著更先進半導體的龐大需求。除此之外,相關監管法規預期也將針對車用級晶片提出極具挑戰性的安全與可靠度要求。而這些需求應該在廣泛的運作條件與日益延長的產品壽命等考量下,被充分理解並予以管理。

那麼,現代汽車晶片的要求為何?

  • 延長壽命與服務保固:汽車為 15 年,零組件則為 30 年以上
  • 擴展運作範圍:包含溫度、機械與環境等面向
  • 零缺陷:0 次測試逃脫(test escape)、0 次現場故障或更合理的 10 DPPB (Defective Parts Per Billion,即每十億分之一的零件缺陷率)
  • 嚴格的運作故障率目標:10 或 100 FITs
  • 對產品與元件效能進行持續監控與改善
  • 預測性維護(Predictive Maintenance) 

車用晶片面臨的挑戰

前所未有的尖端技術製程、先進 IP與繁複設計,讓車用晶片與解決方案供應商面臨製程變異(process variability)、老化(aging)與退化(degradation)所致的風險。物理缺陷是無可避免的,其中包含測試逃脫、潛在缺陷與應力引起的缺陷。一般而言,使用強度可說是一種催化劑,受到頻繁重度使用的零件會更快發生故障。

晶片本質上並不可靠,也與安全毫無相關。但是只要付出相對應的「代價」,晶片就可以根據需求變得可靠且安全。這些代價包括設計工作、增加的電路、功率與效能的經常性費用,以及不斷增加的開發成本等。

使用強度對產品壽命的影響

許多產品都是在動態的操作或環境條件下運作,尤其是車輛,必須應對極端天氣變化、劇烈振動、複雜的相互連結性以及驅動晶片設計的其他物理影響等。可靠度工程師會將這些因素納入任務剖析(mission profile)清單中,並在進行故障分析時加以運用。然後,這些裝置被設計成可針對代表性任務剖析達到可靠度與安全預期。通常預期使用壽命可單純以指定溫度下的工作時數呈現。特別針對汽車的可靠度分析,(預期的)「任務剖析」被定義為元件在其使用壽命和相應的工作時數內,所面臨的相關環境與功能負載的集合。最簡單的形式是以溫度為基礎的任務剖析,透過表格呈現出處於某個溫度下所經歷的時間。除此之外,更多繁複的應用場景(像是在停車場/怠速/市區行駛/高速公路行駛等所花費的時間)也會被納入其中。在設計階段期間,我們會投入時間進行所有必要的精準審核(due diligence),以確保裝置能夠成功滿足應用要求。

我們想實現的目標是什麼?

在「更嚴苛」的環境中,裝置磨損速度可能會比預期地更快,而導致可靠度與品質問題。因此,目標是在於測量並解讀電路監控器(in-circuit monitor)測得的數據資料,將實測情況跟預期的情況進行比較,並提出可行見解(actionable insights)來協助應對操作/執行環境中所面臨的挑戰。

這些計算中使用的核心概念為元件所承受的強度,並根據溫度與電壓等運作條件進行評估。對於絕大多數的故障機制而言,溫度是一項強大的加速因子,通常以著名的阿瑞尼斯方程式(Arrhenius equation)進行建模。電壓越高也會導致強度增加,可以透過電壓加速(voltage acceleration)或強度因子來體現。最後,訊號的狀態(負載因子,duty factor)或活動(轉換)也在特定退化機制的惡化中扮演重要角色。

可能要復原並解讀環境監測器(電壓/溫度/訊號與電路活動/工作負載等,如果有的話)所測量的資料,才能建置可精準反映產品實際使用(in-field)狀況的任務剖析。

建置監控與分析架構

新思科技透過「晶片生命週期管理 (Silicon Lifecycle Management, SLM)」全方位解決方案的分析技術,在深矽(deep-silicon)可觀測性(observability)市場中扮演著領導角色。SLM 的主要差異在於能夠讓客戶透過端到端(end-to-end)解決方案使用經實際矽晶驗證(silicon-proven)的感測器 IP(包含硬體與軟體)。其中涵蓋自動化實作(implementation)、利用感測器資料來加速新產品上市和良率提升(yield ramp),或者在正常現場運作期間進行洞察分析,最終實現裝置層級(device-level)和車隊層級(fleet-level)的壽命可靠度管理。

新思科技提供了一個豐富的製程、電壓與溫度(Process, Voltage and Temperature, PVT) 監測器元件資料庫,可以智慧化地嵌入設計中,在足夠的空間與時間粒度(granularity)下進行環境和活動資料監測。除此之外,我們也提供分析輔助資料檔(晶載與晶片外元件資料庫與工具集) ,此為一種預測性架構,可將資料處理成有意義的可靠度與功能安全(functional safety)指標,並藉由數據可視化工具(dashboard)將結果轉化為可行的車隊層級摘要。

從晶片供應商所提供的平均故障時間(Meant-Time-To-Failure, MTTF)基準資料開始,累積的強度會逐漸縮短零件的預期壽命,讓實地(in-field)和雲端(cloud)的 SLM軟體能夠持續評估汽車或車隊晶片中每個元件的剩餘使用壽命(Remaining Useful Life, RUL)、故障時間(Failure-in-Time, FIT)、故障率與更新的安全操作區域 (Safe Operating Area, SOA) 等指標。整體而言,這是一種以預測為基礎的間接方法。

此外,還可以利用實地監控器所取得的現場量測資料,預測產品的各個元件、甚至完整系統的剩餘使用壽命。路徑裕度監控器 (Path Margin Monitors, PMM)、製程偵測器(Process Detectors, PD)、時序與延遲監控器(Clock and Delay Monitor, CDM)、以及UCIe監控、追蹤與修復IP (Monitor, Track and Repair, MTR IP)均提供前所未有的深矽資料,以及對電路實際狀態更直接的測量。所收集的資料會評估電路的健康狀態與退化率,以及目前的效能裕度(margin)。邏輯與記憶體 BIST 等感測器的完整性資料也是對電路所承受的所有故障、錯誤、失效與缺陷進行的直接測量。總結來看,這是一種基於觀測的直接方法。

最後,對老化、退化與磨損問題進行一致的車隊層級管理,可將零星且罕見的(裝置層級)退化事件彙總為重要趨勢與群體層級的觀測結果,並針對技術、IP與設計的韌性(resiliency)提供非凡見解。

預測性維護(predictive maintenance)概念

為因應半導體壽命的全新挑戰,ISO/TR 9839「道路車輛 – 根據ISO 26262-5 對硬體進行預測性維護的應用」工作小組[1]針對第三版ISO 26262建立了一份建議清單。在這項提案中,從早期模型和設計到現場應用,對於老化或強度過大(over-stressed)狀況所造成的退化性間歇故障(degrading intermittent faults),都必須根據基於永久(permanent)和暫時性(transient)故障的考量加以管理。

預測性維護概念可作為有效的安全機制來抵禦退化性間歇故障,並針對間歇故障提供充分又即時的偵測與覆蓋。而前述建議的標準更新,針對預測性維護技術提出兩種應用。

第一個使用案例調查由隨機事件造成的故障。如果故障導致壽命提前終止(End-of-Life),是因為依循可直接在線(online)測量的已知退化物理定律(degradation physical law),那麼預測技術就有助於減緩故障的影響。使用新思科技電路(in-circuit)監控器、RO、PMM、CDM、MTR以及相關分析,即可成功完成此案例。

第二個使用案例,則解決了系統性電路退化所導致的故障。在這種情況下,可使用實際(「線上」)測量的任務剖析資料來執行退化或老化模型,以進行壽命終止的計算。使用建議的基於預測的間接方法可實現這個目標,即透過分析處理新思科技監控IP提供的測量環境電壓、溫度與工作負載資料。

結論

新思科技的 SLM 方案提供豐富的IP元件資料庫、分析原理與技術工具,可實作最高效的任務剖析與預測性維護架構。

其所提出的方法可以滿足最先進(state-of-the-art, SOTA)、直接的加速因子,乃至於基於感測器的複雜邏輯與記憶體健康狀態評估。在經濟層面上,此解決方案可在晶載(on-chip)、邊緣(edge)或雲端(cloud)平台進行實作,並提供高度差異化的見解,可用於提升可靠度並改善現場運作。

如欲瞭解新思科技 SLM 解決方案詳細資訊,請造訪我們的網站

 

參考資料