
A Reconfigurable and Extensible Exploration Platform for Future Heterogeneous Systems
Informazioni sul documento
Autore | Mirko Gagliardi |
Scuola | Università degli Studi di Napoli Federico II |
Specialità | Information Technology and Electrical Engineering |
Anno di pubblicazione | XXXI |
Luogo | Napoli |
Tipo di documento | Ph.D. thesis |
Lingua | English |
Numero di pagine | 121 |
Formato | |
Dimensione | 2.40 MB |
- Heterogeneous Computing
- High-Performance Computing
- Reconfigurable Systems
Riassunto
I. Introduzione
L'argomento della reconfigurabilità e dell'estensibilità nelle architetture di calcolo eterogeneo è di crescente importanza nel contesto dell'High-Performance Computing (HPC). La tesi esplora come le architetture eterogenee possano essere ottimizzate per migliorare l'efficienza energetica e le prestazioni. L'uso di componenti personalizzati è spesso limitato, mentre i sistemi attuali si basano su CPU e GPU di alta gamma. Tuttavia, l'hardware a scopo generale presenta limitazioni in termini di efficienza energetica, misurata in GFLOPS-per-Watt. La tesi propone un'analisi approfondita delle architetture many-core e della personalizzazione architettonica, evidenziando la necessità di esplorazioni più profonde per sviluppare soluzioni innovative. La ricerca si concentra su meccanismi di coerenza e reti su chip (NoC), presentando un sistema di memoria scratchpad non coerente con un sistema di rimappatura configurabile per ridurre i conflitti di banca. Le soluzioni proposte mirano a migliorare la programmabilità e la portabilità delle applicazioni.
1.1 Obiettivi della Ricerca
La ricerca si propone di affrontare le sfide legate alla coerenza e alla sincronizzazione in architetture many-core. L'implementazione di un master di sincronizzazione distribuito è presentata come una soluzione più adatta rispetto alle soluzioni centralizzate standard. Questo approccio, ispirato al meccanismo di coerenza basato su directory, consente sincronizzazioni concorrenti senza dipendere dalle transazioni di memoria. I risultati sperimentali indicano che l'uso di un supporto hardware dedicato per la sincronizzazione può ridurre significativamente i costi di area e migliorare le prestazioni complessive del sistema. La tesi dimostra che l'adozione di un sistema di coerenza avanzato, basato su un approccio a directory sparsa, può ottimizzare ulteriormente le prestazioni, consentendo la disattivazione della coerenza per blocchi non necessari.
II. Piattaforma di Esplorazione Many Core
La piattaforma di esplorazione many-core proposta è progettata per supportare l'esplorazione di architetture di calcolo ad alte prestazioni. Essa integra un core acceleratore simile a una GPU e un sottosistema di coerenza riconfigurabile, garantendo capacità di configurazione specifiche per le applicazioni. La modularità del sistema consente l'integrazione di soluzioni hardware/software innovative su scala di sistema completo. Le soluzioni esplorate sono state valutate su un sistema eterogeneo reale, dimostrando l'efficacia della piattaforma nel supportare un'analisi approfondita delle architetture eterogenee. La piattaforma offre un vantaggio chiave, permettendo agli utenti di integrare nuove soluzioni in modo più efficiente rispetto alle piattaforme esistenti, che non sempre supportano un'esplorazione architettonica eterogenea completa.
2.1 Vantaggi della Modularità
La modularità della piattaforma consente una rapida prototipazione e test di nuove architetture. La possibilità di configurare e riconfigurare i componenti hardware in base alle esigenze specifiche delle applicazioni rappresenta un valore aggiunto significativo. Le architetture eterogenee possono essere adattate per ottimizzare le prestazioni in scenari diversi, come il calcolo ad alte prestazioni e i sistemi embedded. La ricerca dimostra che l'adozione di un approccio modulare non solo migliora l'efficienza energetica, ma consente anche una maggiore flessibilità nella progettazione e nello sviluppo di sistemi complessi.
III. Conclusioni e Applicazioni Future
Le conclusioni della tesi evidenziano l'importanza della personalizzazione e della coerenza nelle architetture eterogenee. Le soluzioni proposte non solo affrontano le sfide attuali, ma aprono anche la strada a future ricerche nel campo del calcolo eterogeneo. L'implementazione di sistemi di coerenza avanzati e di architetture many-core modulari rappresenta un passo significativo verso l'ottimizzazione delle prestazioni nei sistemi di calcolo. Le applicazioni pratiche di queste ricerche si estendono a vari settori, inclusi l'HPC, l'embedded computing e l'intelligenza artificiale. La tesi sottolinea che l'innovazione continua in questo campo è cruciale per affrontare le crescenti esigenze di prestazioni e efficienza energetica.
3.1 Implicazioni per la Ricerca Futura
Le implicazioni della ricerca sono significative per il futuro del calcolo eterogeneo. La necessità di architetture più efficienti e personalizzabili è evidente, e le soluzioni proposte possono servire da base per ulteriori sviluppi. La ricerca futura dovrebbe concentrarsi sull'integrazione di tecnologie emergenti, come i sistemi basati su FPGA e le architetture neuromorfiche, per migliorare ulteriormente le prestazioni e l'efficienza energetica. La continua evoluzione delle tecnologie di calcolo richiede un approccio proattivo e innovativo per affrontare le sfide emergenti nel campo dell'informatica.
Riferimento del documento
- Customizable heterogeneous acceleration for tomorrow’s high-performance computing (Cilardo, A., Flich, J., Gagliardi, M., Gavila, R.T.)
- A Configurable Shared Scratchpad Memory for GPU-like Processors (Cilardo, A., Gagliardi, M., Donnarumma, C.)
- NoC-Based Thread Synchronization in a Custom Manycore System (Cilardo, A., Gagliardi, M., Passaretti, D.)
- Improving Deep Learning with a customizable GPU-like FPGA-based accelerator (Gagliardi, M., Fusella, E., Cilardo, A.)
- PowerTap: All-digital power meter modeling for run-time power monitoring (Zoni, D., Cremona, L., Cilardo, A., Gagliardi, M., Fornaciari, W.)