L'IP hardware configurabile Flex Logix per carichi di lavoro AI e DSP unisce FPGA, unità tensore e software

Notizia

CasaCasa / Notizia / L'IP hardware configurabile Flex Logix per carichi di lavoro AI e DSP unisce FPGA, unità tensore e software

Nov 11, 2023

L'IP hardware configurabile Flex Logix per carichi di lavoro AI e DSP unisce FPGA, unità tensore e software

Today, we’re going to talk about AI, DSP, FPGAs, IP, and SoCs. Normally, these

Oggi parleremo di AI, DSP, FPGA, IP e SoC. Normalmente, queste cose non vanno tutte insieme. Certamente, gli FPGA sono stati utilizzati per implementare algoritmi AI e DSP, sebbene gli algoritmi AI e DSP generalmente coinvolgano diversi tipi di calcoli. (Vedi "Una breve storia del DSP a chip singolo, parte II.") I progetti DSP sono rimasti in gran parte con le implementazioni FPGA, grazie all'abbondanza di moltiplicatori/accumulatori (MAC) che forniscono, mentre l'addestramento dell'intelligenza artificiale è migrato alle GPU. Al giorno d'oggi, l'inferenza dell'intelligenza artificiale si è spostata verso molteplici implementazioni hardware, tra cui CPU aumentate, chip dedicati, motori AI appositamente realizzati per SoC e persino FPGA. Ora, Flex Logix ha introdotto un'altra alternativa: IP hardware configurabile progettato specificamente per eseguire carichi di lavoro AI e DSP.

Fondata nel 2014, Flex Logix non è una novità nel campo dell'IP hardware configurabile. L'azienda offre moduli IP e software EFLEX embedded FPGA (eFPGA) da quasi un decennio. Secondo Geoff Tate, co-fondatore e CEO di Flex Logix, l'azienda ha ora diversi clienti legati alla difesa e più di una mezza dozzina di clienti commerciali con 23 chip diversi in produzione in grandi volumi che incorporano eFPGA EFLEX. Esempi di tali dispositivi vanno da un SoC MIMO 5G di fascia alta di un cliente senza nome che integra un eFPGA da 100K-LUT (tabella di ricerca) insieme a più front-end digitali di trasmissione e ricezione per l'interfaccia dell'antenna MIMO a una nuova linea di dispositivi piccoli ed economici Renesas ForgeFPGA con LUT da 1K a 4K che possono costare meno di 50 centesimi in volume.

Figura 1: Gli FPGA Renesas Forge, piccoli ed economici, si basano sull'IP FPGA Flex Logix e gli strumenti di sviluppo si basano sugli strumenti forniti da Flex Logix. Credito immagine: Flex Logix

Gli FPGA di Renesas Forge fanno risalire la loro discendenza ai dispositivi Silego, di cui il mio amico e collega Max Maxfield ha scritto in precedenza. (Vedi "Non è successo o è successo molto?" e ​​"Renesas annuncia la favolosa famiglia ForgeFPGA.") Dialog Semiconductor ha acquistato Silego nel 2017 ed è stata a sua volta acquistata da Renesas nel 2021, ed è così che Renesas è diventata un fornitore di FPGA. I pesci piccoli vengono mangiati dai pesci più grandi, che a loro volta vengono mangiati dai pesci ancora più grandi.

Gli FPGA Renesas forniscono una versione del software FPGA Flex Logix direttamente agli sviluppatori per la configurazione dei dispositivi ForceFlex, il che indica che Flex Logix può fornire software utilizzabile direttamente agli sviluppatori di sistemi. Si tratta di una funzionalità importante quando si entra nel mercato dell'intelligenza artificiale, dove si desidera consentire a data scientist e programmatori senza esperienza nello sviluppo hardware di utilizzare facilmente i propri prodotti.

In molti modi, questi nuovi riquadri hardware Flex Logix InferX fanno risalire la loro discendenza ai riquadri eFPGA dell'azienda. I moduli InferX IP sono IP rinforzati, forniti da Flex Logix a un cliente per uno specifico nodo di produzione di circuiti integrati presso una fonderia specifica. In questo modo, InferX IP è proprio come l'EFLEX FPGA IP dell'azienda. Nel caso dell'IP InferX, Flex Logix inizialmente prende di mira il nodo di processo N5 a 5 nm di TSMC, ma la società afferma che qualsiasi processo FinFET è un candidato per questo IP.

Inoltre, gli algoritmi AI e DSP eseguono un gran numero di operazioni di moltiplicazione/accumulo. Gli FPGA, inclusi i moduli eFPGA Flex Logix, generalmente forniscono molti, molti moltiplicatori/accumulatori per eseguire tutte queste operazioni in tempo reale, ma questi MAC sono incorporati nel tessuto FPGA come l'uvetta nella deliziosa ricetta del budino di riso del venerdì sera di mia nonna, che erano relativamente pochi e rari. In un FPGA, i MAC rinforzati sono circondati dalla struttura di interconnessione dell'FPGA per consentire la creazione di qualsiasi tipo di pipeline di esecuzione. Tuttavia, gli algoritmi AI e DSP non necessitano di questo tipo di flessibilità (le loro pipeline di calcolo sono molto più regolari), quindi il sovraccarico di silicio delle strutture di routing di un FPGA è superfluo e può essere rimosso. Il sovraccarico di silicio è significativo e, secondo Tate, può rappresentare fino all'80% del silicio nell'area all'interno e intorno ai MAC.

Invece, Flex Logix ha preso il design del suo MAC, lo ha migliorato per le operazioni AI e DSP e ha creato un'unità tensore cablata che interconnette un gran numero di MAC con un'interconnessione rafforzata, proprio come verrebbe progettato un SoC. Il riquadro IP hardware InferX risultante combina quattro di queste unità tensori con singole cache SRAM L2 e un piccolo eFPGA utilizzato per configurare e interconnettere le unità tensori, come mostrato nella Figura 2 di seguito.