GRAID mette RAID su una GPU per la protezione e le ricostruzioni del disco a prezzo ridotto

Usa una scheda grafica Nvidia come controller RAID: questa è l’idea di SupremeRAID dall’avvio statunitense GRAID. Per meno di $ 4.000, può controllare 32 SSD NVMe e raggiungere un throughput di lettura di 110 GBps e 19 milioni di IOPS.

In confronto, la scheda LSI MegaRAID di Broadcom, la concorrente più vicina, supporta solo quattro SSD NVMe con letture a un throughput massimo di 13,5 GBps e meno di 200.000 IOPS in letture.

La differenza tra le due carte? Quello di Broadcom utilizza un ASIC su misura del produttore.

“Abbiamo iniziato cercando di sviluppare una scheda RAID da un chip specializzato fin dall’inizio, nel nostro caso un FPGA”, ha affermato Leander Yu, CEO di GRAID durante una recente presentazione dell’IT Press Tour alla pubblicazione gemella di ComputerWeekly.com LeMagIT. “Ma siamo rimasti rapidamente delusi. Per ottenere i 19 milioni di IOPS che volevamo, i nostri FPGA sarebbero costati $ 30.000 ciascuno, ma non avrebbe senso.

“Ma RAID è solo la condivisione dell’accesso tra flussi paralleli e le GPU sono fatte per parallelizzare un flusso di pixel, quindi abbiamo avuto l’idea di prendere una semplice scheda grafica disponibile in commercio per poche centinaia di dollari”.

Quindi, SupremeRAID SR-1010 è davvero solo una Nvidia RTX A2000, una scheda grafica entry-level per workstation disponibile per meno di € 600.

“Onestamente, utilizziamo meno del 50% delle sue prestazioni”, ha affermato Yu. “Ma poi usiamo una carta di livello professionale. Quelli rivolti al grande pubblico non hanno la memoria per correggere gli errori e sono meno affidabili. Non possiamo tollerare la perdita di un singolo byte nei casi d’uso di archiviazione”.

SupremeRAID SR-1010 è l’ultima incarnazione e funziona su PCIe 4.0. In precedenza, esisteva una versione SR-1000 su PCIe 3.0 che raggiungeva 16 milioni di IOPS in lettura e veniva venduta per $ 2.500. L’SR-1010 ha un prezzo di $ 3.995.

Yu ha detto che pensava che la soluzione Broadcom fosse stata sviluppata durante l’era degli HDD a disco rotante. Ciò, ha affermato, li rende obsoleti per gli SSD NVMe, che non comunicano con le porte SATA o SAS, ma utilizzano invece i canali PCIe.

12 volte più veloce in scrittura

Il know-how tecnico di GRAID fornisce il software per RAID 0, 1, 5, 6, 10 e la codifica di cancellazione su GPU.

“Vendiamo la soluzione completa, con la carta”, ha affermato Tom Paquette, vicepresidente senior e GM di GRAID. “Ma stiamo anche discutendo con produttori di server e fornitori di servizi cloud che acquistano grandi quantità di schede grafiche e siamo aperti a vendere potenzialmente solo il software”.

In pratica la scheda funziona solo come gateway durante la scrittura, perché è in quella fase che prende il flusso e crea dei frammenti che verranno scritti in parallelo ad una velocità massima ottimale. In questa configurazione, il throughput in scrittura dal punto di vista del server è di 12 GBps, ovvero la velocità massima del bus PCIe 4.0 a 16 canali tramite il quale è collegato il SupremeRAID.

Durante l’output, la scheda comunica con ciascun SSD a un throughput individuale di 7 GBps, che si ottiene su un bus PCIe 4.0 quando utilizza il massimo di quattro canali. Ma se si conteggia il throughput globale degli SSD, questo sale a 22 GBps a causa dei duplicati creati dal motore RAID.

GRAID confronta il suo prodotto con “un controller RAID hardware competitivo” senza citare direttamente Broadcom, che può scrivere un totale di 4 GBps sugli SSD

Nessun collo di bottiglia durante le letture

È durante le letture che il prodotto è particolarmente efficiente.

“Il punto chiave della nostra soluzione è che non comunica al server i dati che deve caricare”, ha affermato Paquette. “Dice su quali SSD caricarli e il server li legge direttamente da diversi SSD in parallelo.”

È così che è possibile raggiungere 110 GBps su un server con due CPU Xeon 6338 da 2 GHz con 32 core ciascuna, ha affermato.

Al contrario, il prodotto Broadcom continua a funzionare come gateway mentre i dati vengono letti dall’SSD.

Paquette ha aggiunto: “Non ci limitiamo agli SSD interni. Possiamo comunicare con un controller NVMe-over-fabrics installato in un altro slot PCIe che guida SSD in uno scaffale esterno. In altre parole, possiamo, in casi estremi, fornire RAID per leggere e scrivere tutti i dati su SSD interni ed esterni. Siamo l’unico fornitore a offrire RAID compatibile con NVMe-over-fabrics”.

Paquette ha affermato che il limite di 32 SSD non è dovuto alla capacità della scheda Nvidia, ma al software GRAID. “Questi numeri miglioreranno gradualmente con i nostri aggiornamenti e le capacità dell’hardware che supporta gli SSD”, ha aggiunto. “Ma è già previsto che il nostro software possa essere utilizzato con l’architettura componibile CXL.”

Velocità della GPU applicata alle ricostruzioni RAID

Le ricostruzioni del disco e il tempo che impiegano sono un grosso problema in RAID. Vengono eseguiti quando un’unità si guasta e facendo riferimento a dati duplicati sui dischi rimanenti. Normalmente, ciò richiede molta potenza di elaborazione, ed è qui che la GPU sulla scheda grafica può mostrare il suo potenziale.

“È molto semplice: possiamo ricostruire un sistema RAID in due ore che normalmente richiederebbero tre settimane”, ha affermato Paquette, senza specificare una capacità per tale ricostruzione.

Secondo misure più precise, la scheda GRAID SupremeRAID consente una velocità di accesso di 5,5 milioni di IOPS in lettura e 1,1 IOPS in scrittura durante le ricostruzioni. Il Broadcom MegaRAID, nel frattempo, raggiunge rispettivamente 36.000 e 18.000 IOPS.

Per l’apprendimento automatico e la registrazione video continua

Tra i casi d’uso citati per SupremeRAID, GRAID mette in evidenza il machine learning, dove c’è una necessità costante di mettere in memoria grandi volumi di dati. Secondo il fornitore, un algoritmo che di solito impiega 12 ore per funzionare con i dati archiviati nel NAS e tramite NFS impiegherà solo due ore utilizzando la connettività NVMe-over-ROCE e un server di archiviazione fornito con un controller di GRAID.

Un altro esempio è la registrazione video, con l’esempio fornito dalle corse automobilistiche e con un throughput richiesto di 10 GBps tra la fotocamera e lo storage e che può beneficiare della protezione RAID 5 o 6.

“Le organizzazioni acquistano quantità crescenti di SSD NVMe per le loro prestazioni, ma si trovano nella situazione paradossale in cui queste prestazioni hanno un impatto sulle loro applicazioni”, ha affermato Paquette. Questo perché le CPU hanno dedicato cicli alla gestione del RAID su questi SSD.

Prossimamente: PCIe 5.0 e codifica di cancellazione

In questo momento, il software SupremeRAID sta passando alla versione 1.3 e per supportare più distribuzioni Linux. Sarà inoltre possibile installare due schede in un server per motivi di ridondanza (ma non per raddoppiare le prestazioni o il numero di unità).

Nel 2023, il software riceverà una GUI di amministrazione in Windows, la codifica di cancellazione che consentirà RAID tra diverse schede e il supporto per PCIe 5.0 di nuova generazione. Gli elementi della roadmap includeranno anche la compatibilità VMware e Kubernetes, oltre a compressione, crittografia e deduplicazione al volo.

Leave a Comment

Your email address will not be published. Required fields are marked *