確保可以避免晶片在使用現場出現故障的自動化方法

英文原文:An Automated Method to Ensure Designs Are Failure-Proof in the Field

2023年 6月13日於《SemiWiki》刊登

不知道您怎麼看,但只要提到關鍵任務應用,我就會立即聯想到太空探索或軍事行動。然而在如今的世界,我們身邊到處充斥著關鍵任務應用。試想一下,在雲端應用的資料,要如何管理、分析和共享,才能執行會涉及到安全性及安全保障的任務;亦或者,以物聯網為基礎的居家安全性系統或煙霧警報器等應用,應該能穩定運作,並在突發狀況發生時發送警報。自駕車有會怎麼樣呢?一次故障可能就會造成嚴重損壞,甚至致命。如果您仔細觀察,就會發現,從旅行到醫療、能源、製造,乃至網路連線,關鍵性任務應用確實存在於人們生活的各個面向。

系統單晶片(SoC) 是這些關鍵任務應用的核心,因此我們要如何確保這些 SoC 不會出現故障呢?我們要如何確認這些設計是否具備足夠韌性,可以因應隨機硬體故障?晶片在開發及驗證過程中,通常會偵測到系統故障,並將其修復,然而,現場的隨機故障通常是無法預測,也難以預先規劃因應措施,進而產生嚴重後果。裝置不但必須穩定,還能依預期的正常運作,而且針對隨機突發的故障,還要具有韌性,能夠修正或緩解這些故障狀況。

裝置也必須能持久耐用。在開發階段可以透過模型、DFM、測試及模擬,將老化效應納入設計穩定性的考量。然而,在設計階段,則必需考慮到隨機故障。安全機制或安全措施 (SM) 設計,是確保關鍵任務設計可以在裝置使用壽命期間,不受單粒子翻轉 (Single Event Upsets, SEUs) 等隨機故障影響的關鍵。

以備援(redundancy)的方式將安全機制/措施添加到設計中以防止 SEU,並不是一個全新的概念,它已經存在數十年了。然而,這種工作很大程度需要手動執行。手動插入安全機制/措施 十分費力,而且容易出錯,因為必須考量物理佈局限制和繞線,以確保這些安全機制/措施不會對重置(reset)、功率或時脈網路訊號等元素產生負面的級聯(cascading)效應。

新思科技合成和實作工具提供完全自動化插入安全機制/措施的方法,讓關鍵任務設計更具韌性。在合成階段可以自動插入元素,而佈局繞線 (place and route, P&R) 工具將有助解決物理實作挑戰,例如:訊號網的佈局距離和繞線獨立性。我們擬定一份技術白皮書,詳細說明加入這些安全機制/措施的流程,分析並驗證這些安全機制/措施符合從 RTL 到 GDSII 的要求。請下載「針對關鍵任務SoC設計增加韌性的自動化方法」技術白皮書,瞭解更多資訊。

針對關鍵任務SoC設計增加韌性的自動化方法

採用抗輻射強化元件或備援系統,將安全措施導入系統單晶片設計,對於航太與國防 (Aerospace and Defense, A&D)、雲端、汽車、機器人、醫藥和物聯網 (Internet-of-Things, IoT) 等產業領域相關的關鍵任務應用至關重要,有助於更具有彈性地因應隨機硬體故障。設計可靠且具韌性的功能確實會對半導體開發產生影響,其中這些安全措施通常已經由 SoC 設計人員手動插入。手動方法通常可能會造成無法解釋的故障。新思科技建立了一套完全自動化的實作流程,以插入各種類型的安全機制,而這些安全機制可以實現更穩定、更具韌性的關鍵任務 SoC 設計。

技術白皮書下載

本篇技術白皮書會探討在設計中實施安全機制/措施的流程,讓機制和措施更具韌性,並分析從啟動設計到最終產品的有效性。