Scopri FathomNet: un database di immagini open-source che utilizza algoritmi di intelligenza artificiale e apprendimento automatico per aiutare a elaborare l’arretrato di dati visivi per comprendere il nostro oceano e i suoi abitanti

L’oceano sta cambiando a un ritmo senza precedenti, il che rende difficile mantenere una gestione responsabile monitorando visivamente grandi quantità di dati marini. La quantità e la velocità della raccolta dei dati necessari stanno superando la nostra capacità di elaborarli e analizzarli rapidamente mentre la comunità di ricerca cerca le linee di base. La mancanza di coerenza dei dati, la formattazione inadeguata e il desiderio di set di dati significativi ed etichettati hanno tutti contribuito al limitato successo dei recenti progressi nell’apprendimento automatico, che hanno consentito un’analisi visiva dei dati rapida e più complessa.

Per soddisfare questo requisito, diversi istituti di ricerca hanno collaborato con MBARI per accelerare la ricerca oceanica utilizzando le capacità dell’intelligenza artificiale e dell’apprendimento automatico. Uno di questi risultati di questa partnership è FathomNet, un database di immagini open source che utilizza algoritmi di elaborazione dati all’avanguardia per standardizzare e aggregare dati etichettati accuratamente curati. Il team ritiene che l’uso dell’intelligenza artificiale e dell’apprendimento automatico sarà l’unico modo per accelerare gli studi critici sulla salute degli oceani e rimuovere il collo di bottiglia per l’elaborazione delle immagini subacquee. I dettagli sul processo di sviluppo alla base di questo nuovo database di immagini possono essere trovati in una recente pubblicazione di ricerca sulla rivista Scientific Reports.

L’apprendimento automatico ha storicamente trasformato il campo dell’analisi visiva automatizzata, in parte grazie a grandi volumi di dati annotati. Quando si tratta di applicazioni terrestri, i set di dati di riferimento a cui si affollano i ricercatori di machine learning e computer vision sono ImageNet e Microsoft COCO. Per offrire ai ricercatori uno standard ricco e coinvolgente per l’analisi visiva subacquea, il team ha creato FathomNet. Al fine di creare una risorsa di formazione sulle immagini subacquee facilmente accessibile e altamente mantenuta, FathomNet combina immagini e registrazioni da molte fonti diverse.

I ricercatori del Video Lab di MBARI hanno annotato attentamente i dati che rappresentano quasi 28.000 ore di video di acque profonde e più di 1 milione di foto di acque profonde che MBARI ha raccolto in 35 anni. Nella videoteca di MBARI sono presenti circa 8,2 milioni di annotazioni che documentano osservazioni di animali, ecosistemi e oggetti. Questo set di dati completo funge da strumento inestimabile per i ricercatori dell’istituto e le loro collaborazioni internazionali. Oltre 1.000 ore di dati video sono state raccolte dall’Exploration Technology Lab della National Geographic Society da vari habitat marini e luoghi in tutti i bacini oceanici. Queste registrazioni sono state utilizzate anche nella piattaforma di analisi collaborativa basata su cloud sviluppata da CVision AI e annotata da esperti dell’Università delle Hawaii e di OceansTurn.

Inoltre, nel 2010, il team di esplorazione oceanica della National Oceanic and Atmospheric Administration (NOAA) a bordo della nave NOAA Okeanos Explorer ha raccolto dati video utilizzando un doppio sistema di veicoli azionato a distanza. Per annotare i video raccolti in modo più ampio, hanno iniziato a finanziare tassonomi professionisti nel 2015. Inizialmente, hanno raccolto le annotazioni in crowdsourcing tramite scienziati partecipanti volontari. Una parte del set di dati di MBARI, così come i materiali di National Geographic e NOAA, sono tutti inclusi in FathomNet.

Poiché FathomNet è open source, altre istituzioni possono contribuire prontamente e utilizzarlo al posto di metodi convenzionali per l’elaborazione e l’analisi dei dati visivi, che richiedono più tempo e risorse. Inoltre, MBARI ha avviato un’iniziativa pilota per utilizzare modelli di apprendimento automatico addestrati sui dati di FathomNet per analizzare i video ripresi da veicoli sottomarini (ROV) controllati a distanza. L’utilizzo di algoritmi di intelligenza artificiale ha aumentato di dieci volte il tasso di etichettatura riducendo lo sforzo umano dell’81%. Gli algoritmi di apprendimento automatico basati sui dati di FathomNet possono rivoluzionare l’esplorazione e il monitoraggio degli oceani. Uno di questi esempi include l’utilizzo di veicoli robotici dotati di telecamere e algoritmi di apprendimento automatico avanzati per la ricerca e il monitoraggio automatici della vita marina e di altre cose sottomarine.

Con i contributi in corso, FathomNet ha attualmente 84.454 immagini che riflettono 175.875 località da 81 diverse raccolte per 2.243 concetti. Il set di dati avrà presto più di 200 milioni di osservazioni dopo aver ottenuto 1.000 osservazioni indipendenti per più di 200.000 specie animali in varie posizioni e impostazioni di imaging. Quattro anni fa, la mancanza di foto annotate ha impedito al machine learning di esaminare migliaia di ore di filmati oceanici. Sbloccando le scoperte e abilitando strumenti che esploratori, scienziati e il pubblico in generale possono utilizzare per accelerare il ritmo della ricerca oceanica, FathomNet, tuttavia, trasforma questa visione in realtà.

FathomNet è una fantastica illustrazione di come la collaborazione e la scienza della comunità possono promuovere innovazioni nella nostra comprensione dell’oceano. Il team ritiene che il set di dati possa aiutare ad accelerare la ricerca oceanica quando la comprensione dell’oceano è più cruciale che mai, utilizzando i dati di MBARI e degli altri collaboratori come base. I ricercatori sottolineano anche il loro desiderio che FathomNet funzioni come una comunità in cui gli appassionati dell’oceano e gli esploratori di ogni ceto sociale possano condividere le proprie conoscenze e abilità. Ciò fungerà da trampolino di lancio per affrontare i problemi con i dati visivi oceanici che altrimenti non sarebbero stati realizzabili senza una partecipazione diffusa. Al fine di accelerare l’elaborazione dei dati visivi e creare un oceano sostenibile e sano, FathomNet viene costantemente migliorato per includere dati più etichettati dalla comunità.

This Article is written as a research summary article by Marktechpost Staff based on the research paper 'FathomNet: A global image
database for enabling artifcial intelligence in the ocean'. All Credit For This Research Goes To Researchers on This Project. Check out the paper, tool and reference article.
Please Don't Forget To Join Our ML Subreddit


Khushboo Gupta è uno stagista di consulenza presso MarktechPost. Attualmente sta perseguendo il suo B.Tech presso l’Indian Institute of Technology (IIT), Goa. È appassionata di Machine Learning, Natural Language Processing e Web Development. Le piace imparare di più sul campo tecnico partecipando a diverse sfide.


Leave a Comment

Your email address will not be published. Required fields are marked *