Deep learning con la luce | Notizie del MIT

Chiedi a un dispositivo smart home le previsioni del tempo e il dispositivo impiega diversi secondi per rispondere. Uno dei motivi per cui si verifica questa latenza è perché i dispositivi connessi non hanno memoria o potenza sufficienti per archiviare ed eseguire gli enormi modelli di apprendimento automatico necessari affinché il dispositivo capisca cosa gli sta chiedendo un utente. Il modello è archiviato in un data center che potrebbe trovarsi a centinaia di chilometri di distanza, dove la risposta viene calcolata e inviata al dispositivo.

I ricercatori del MIT hanno creato un nuovo metodo per calcolare direttamente su questi dispositivi, che riduce drasticamente questa latenza. La loro tecnica sposta i passaggi ad alta intensità di memoria dell’esecuzione di un modello di apprendimento automatico su un server centrale in cui i componenti del modello sono codificati su onde luminose.

Le onde vengono trasmesse a un dispositivo connesso tramite fibra ottica, che consente l’invio di tonnellate di dati alla velocità della luce attraverso una rete. Il ricevitore utilizza quindi un semplice dispositivo ottico che esegue rapidamente calcoli utilizzando le parti di un modello trasportate da quelle onde luminose.

Questa tecnica porta a più di cento volte il miglioramento dell’efficienza energetica rispetto ad altri metodi. Potrebbe anche migliorare la sicurezza, poiché i dati di un utente non devono essere trasferiti in una posizione centrale per il calcolo.

Questo metodo potrebbe consentire a un’auto a guida autonoma di prendere decisioni in tempo reale utilizzando solo una piccola percentuale dell’energia attualmente richiesta dai computer assetati di energia. Potrebbe anche consentire a un utente di avere una conversazione senza latenza con il proprio dispositivo di casa intelligente, essere utilizzato per l’elaborazione di video in diretta su reti cellulari o persino abilitare la classificazione delle immagini ad alta velocità su un veicolo spaziale a milioni di miglia dalla Terra.

“Ogni volta che vuoi eseguire una rete neurale, devi eseguire il programma e la velocità con cui puoi eseguire il programma dipende dalla velocità con cui puoi reindirizzare il programma dalla memoria. La nostra pipe è enorme: corrisponde all’invio di un lungometraggio completo su Internet ogni millisecondo circa. Questa è la velocità con cui i dati entrano nel nostro sistema. E può calcolare così velocemente”, afferma l’autore senior Dirk Englund, professore associato presso il Dipartimento di ingegneria elettrica e informatica (EECS) e membro del MIT Research Laboratory of Electronics.

Ad unirsi a Englund nel documento c’è l’autore principale e studente laureato EECS Alexander Sludds; Lo studente laureato EECS Saumil Bandyopadhyay, il ricercatore Ryan Hamerly, così come altri del MIT, del MIT Lincoln Laboratory e della Nokia Corporation. La ricerca è pubblicata oggi in Scienza.

Alleggerimento del carico

Le reti neurali sono modelli di apprendimento automatico che utilizzano strati di nodi connessi, o neuroni, per riconoscere i modelli nei set di dati ed eseguire attività, come la classificazione delle immagini o il riconoscimento del parlato. Ma questi modelli possono contenere miliardi di parametri di peso, che sono valori numerici che trasformano i dati di input man mano che vengono elaborati. Questi pesi devono essere memorizzati. Allo stesso tempo, il processo di trasformazione dei dati coinvolge miliardi di calcoli algebrici, che richiedono una grande potenza per essere eseguiti.

Il processo di recupero dei dati (i pesi della rete neurale, in questo caso) dalla memoria e il loro spostamento nelle parti di un computer che eseguono il calcolo effettivo è uno dei maggiori fattori limitanti per la velocità e l’efficienza energetica, afferma Sludds.

“Quindi il nostro pensiero era, perché non prendiamo tutto quel lavoro pesante – il processo di recupero di miliardi di pesi dalla memoria – spostalo lontano dal dispositivo periferico e mettilo in un posto dove abbiamo abbondante accesso a potenza e memoria, il che dà noi la capacità di recuperare quei pesi rapidamente?” lui dice

L’architettura di rete neurale che hanno sviluppato, Netcast, prevede l’archiviazione dei pesi in un server centrale connesso a un nuovo componente hardware chiamato ricetrasmettitore intelligente. Questo ricetrasmettitore intelligente, un chip delle dimensioni di un pollice in grado di ricevere e trasmettere dati, utilizza la tecnologia nota come fotonica del silicio per recuperare trilioni di pesi dalla memoria ogni secondo.

Riceve pesi come segnali elettrici e li imprime sulle onde luminose. Poiché i dati di peso sono codificati come bit (1s e 0s), il ricetrasmettitore li converte commutando i laser; un laser viene acceso per un 1 e spento per uno 0. Combina queste onde luminose e quindi le trasferisce periodicamente attraverso una rete in fibra ottica in modo che un dispositivo client non abbia bisogno di interrogare il server per riceverle.

“L’ottica è eccezionale perché ci sono molti modi per trasportare i dati all’interno dell’ottica. Ad esempio, puoi inserire i dati su diversi colori di luce e ciò consente un throughput di dati molto più elevato e una maggiore larghezza di banda rispetto all’elettronica”, spiega Bandyopadhyay.

Trilioni al secondo

Una volta che le onde luminose arrivano al dispositivo client, un semplice componente ottico noto come modulatore “Mach-Zehnder” a banda larga le utilizza per eseguire calcoli analogici super veloci. Ciò comporta la codifica dei dati di input dal dispositivo, come le informazioni del sensore, sui pesi. Quindi invia ogni singola lunghezza d’onda a un ricevitore che rileva la luce e misura il risultato del calcolo.

I ricercatori hanno escogitato un modo per utilizzare questo modulatore per eseguire trilioni di moltiplicazioni al secondo, il che aumenta notevolmente la velocità di calcolo sul dispositivo utilizzando solo una piccola quantità di energia.

“Per rendere qualcosa più veloce, è necessario renderla più efficiente dal punto di vista energetico. Ma c’è un compromesso. Abbiamo costruito un sistema che può funzionare con circa un milliwatt di potenza ma che fa comunque trilioni di moltiplicazioni al secondo. In termini sia di velocità che di efficienza energetica, questo è un guadagno di ordini di grandezza”, afferma Sludds.

Hanno testato questa architettura inviando pesi su una fibra di 86 chilometri che collega il loro laboratorio al MIT Lincoln Laboratory. Netcast ha consentito l’apprendimento automatico con elevata precisione – 98,7% per la classificazione delle immagini e 98,8% per il riconoscimento delle cifre – a velocità elevate.

“Dovevamo fare un po’ di calibrazione, ma sono rimasto sorpreso da quanto poco lavoro abbiamo dovuto fare per ottenere una precisione così elevata fuori dagli schemi. Siamo stati in grado di ottenere una precisione rilevante dal punto di vista commerciale”, aggiunge Hamerly.

Andando avanti, i ricercatori vogliono eseguire iterazioni sul chip del ricetrasmettitore intelligente per ottenere prestazioni ancora migliori. Vogliono anche miniaturizzare il ricevitore, che attualmente ha le dimensioni di una scatola da scarpe, fino alle dimensioni di un singolo chip in modo che possa adattarsi a un dispositivo intelligente come un telefono cellulare.

“L’uso della fotonica e della luce come piattaforma per l’informatica è un’area di ricerca davvero entusiasmante con implicazioni potenzialmente enormi sulla velocità e l’efficienza del nostro panorama informatico”, afferma Euan Allen, Royal Academy of Engineering Research Fellow presso l’Università di Bath, che non è stato coinvolto in questo lavoro. “Il lavoro di Sludds et al. è un passo entusiasmante per vedere le implementazioni nel mondo reale di tali dispositivi, introducendo un nuovo e pratico schema di edge computing esplorando anche alcune delle limitazioni fondamentali del calcolo a livelli di luce molto bassi (singolo fotone).

La ricerca è finanziata, in parte, da NTT Research, National Science Foundation, Air Force Office of Scientific Research, Air Force Research Laboratory e Army Research Office.

.

Leave a Comment

Your email address will not be published. Required fields are marked *