Una valutazione delle ricerche su Internet come indicatore delle tendenze nella salute mentale della popolazione negli Stati Uniti

Abbiamo utilizzato dati pubblicamente disponibili, resi anonimi e aggregati a livello nazionale dal Symptom Search Dataset (SSD) di Google, che riporta la frequenza relativa delle ricerche su Internet per 420 segni, sintomi e condizioni di salute con protezioni della privacy ben documentate31. Per fare un confronto, abbiamo utilizzato i dati di: (1) il National Syndromic Surveillance Program (NSSP) dei Centers for Disease Control and Prevention (CDC), che tiene traccia delle visite al pronto soccorso (ED) per varie condizioni sanitarie da strutture in 48 stati degli Stati Uniti6 e (2) la Household Pulse Survey (HPS) dell’US Census Bureau che valuta l’impatto sociale ed economico della pandemia7. Le caratteristiche principali di questi set di dati sono riassunte nella Tabella 1.

Tabella 1 Riepilogo delle caratteristiche dei set di dati Google COVID-19 Search Trends, National Surveillance Syndromic Program e Household Pulse Survey utilizzati nel presente studio.

Origine dei dati

SSD è disponibile pubblicamente30 e fornisce serie temporali giornaliere e settimanali del volume relativo di ricerche negli Stati Uniti in inglese o spagnolo per sintomi e condizioni comuni. I dati sono disponibili a livello nazionale, statale e di contea negli Stati Uniti e in altri cinque paesi di lingua inglese. Le query di ricerca relative a ciascun sintomo sono aggregate e rese anonime attraverso l’uso della privacy differenziale32e quindi normalizzato dal volume di ricerca totale in quella regione, come dettagliato altrove31.

SSD è stato creato sfruttando gli strumenti di ricerca web di Google che mappano le query sul Knowledge Graph33,34 entità imparando continuamente le associazioni tra le parole nelle query degli utenti e le entità descritte nelle pagine Web visualizzate a seguito di tali query. I 420 sintomi e condizioni inclusi in SSD rappresentano le entità cercate più frequentemente (per volume di query). Ogni entità (sintomo o condizione) è associata a decine o centinaia di migliaia di singole query emesse dagli utenti di Google su computer desktop o dispositivi mobili. Le virgolette e le maiuscole nelle query vengono ignorate e gli errori di ortografia vengono corretti automaticamente. Query di esempio incluse [lexapro], [depression test]o [signs of depression] per la depressione; [trazodone], [agoraphobia] oro [panic attack] per l’ansia; e [I want to die], [how to die] e [I want to kill myself] per ideazione suicidaria.

Per il presente studio, ci siamo concentrati sulle query di ricerca SSD relative ad ansia, depressione e ideazione suicidaria tra il 1 gennaio 2018 e il 31 dicembre 2020. Abbiamo scelto queste entità a priori perché rappresentano condizioni comuni che vengono ricercate frequentemente e perché della loro elevata rilevanza per la salute mentale della popolazione. Abbiamo anche considerato le ricerche relative alla cinetosi come un presunto controllo negativo in un sottoinsieme delle nostre analisi.

Abbiamo confrontato i dati settimanali a livello nazionale sulle ricerche su Internet misurate da SSD con i dati a livello nazionale sulle visite al pronto soccorso come riportato dal NSSP. L’NSSP è una collaborazione guidata dal CDC per raccogliere, analizzare e condividere dati sanitari elettronici da circa 3500 reparti di emergenza, centri di assistenza urgente e ambulatoriale, strutture sanitarie ospedaliere e laboratori (da qui in poi indicati collettivamente come strutture di pronto soccorso) in 48 stati (esclusi Hawaii e Wyoming) e Washington DC6. Queste strutture rappresentano circa il 70% di tutte le strutture di pronto soccorso degli Stati Uniti. I dati utilizzati in questa analisi sono stati precedentemente utilizzati da Holland et al. (2021)20 e riutilizzato nel presente studio con il permesso degli autori.

Ci siamo concentrati su due variabili riportate da Holland et al. (2021)20: (1) conteggi nazionali delle visite al pronto soccorso settimanali per condizioni di salute mentale associate a disastri naturali o di origine umana, come stress, ansia, sintomi compatibili con disturbo acuto da stress o disturbo post-traumatico da stress e panico, e (2) conteggi nazionali di tentativi di suicidio settimanali. Il set di dati includeva i conteggi settimanali delle visite al pronto soccorso dal 30 dicembre 2018 al 10 ottobre 2020.

Abbiamo inoltre confrontato i dati di ricerca su Internet con i dati dell’HPS. L’HPS è un’indagine nazionale progettata per misurare gli impatti della pandemia di COVID-19 sulla salute economica, fisica e mentale delle famiglie americane7. La fase 1 del sondaggio si è svolta tra il 23 aprile 2020 e il 21 luglio 2020, la fase 2 si è svolta dal 19 agosto 2020 al 26 ottobre 2020 e la fase 3 si è svolta tra il 28 ottobre 2020 e il 29 marzo 2021. Sebbene l’indagine è ancora in corso, nell’analisi corrente abbiamo utilizzato i dati HPS di queste tre fasi35.

Le domande sui sintomi di ansia e depressione sono state somministrate in tutte le fasi dell’indagine, mentre le domande relative all’assistenza sanitaria mentale sono state incluse nelle fasi 2 e 3. Le domande sui sintomi di ansia e depressione includevano 4 item che sono una versione modificata dei due item Questionario sulla salute del paziente (PHQ-2) e questionari sul disturbo d’ansia generalizzato (GAD-2) a due voci. Per ciascuna domanda, le risposte coprivano gli ultimi 7 giorni e sono state codificate come segue: per niente = 0, diversi giorni = 1, più della metà dei giorni = 2 e quasi ogni giorno = 3. I punteggi per ansia e depressione sono stati ottenuti da sommando le risposte alle due domande per ciascun costrutto. La percentuale di intervistati che ottengono un punteggio pari o superiore a 3 su questi punteggi sommati viene utilizzata nell’analisi dei risultati del sondaggio. Gli item che indicizzano l’assistenza per la salute mentale hanno valutato la percentuale di adulti nelle ultime 4 settimane che hanno riferito di aver assunto farmaci su prescrizione, di aver ricevuto consulenza o terapia da un professionista della salute mentale o che avevano bisogno di consulenza o terapia da un professionista della salute mentale ma non li hanno ricevuti (es. bisogni insoddisfatti ).

analisi statistiche

Per prima cosa abbiamo utilizzato approcci grafici e statistiche descrittive per identificare i modelli temporali nelle ricerche su Internet relative ad ansia, depressione e ideazione suicidaria. Abbiamo quindi adattato un modello lineare generalizzato con una funzione di collegamento log per quantificare gli impatti sui volumi di ricerca relativi associati alla settimana del Ringraziamento e delle festività natalizie e all’inizio della pandemia COVID-19 (definita come le prime 4 settimane di marzo 2020) , adeguandosi all’anno solare e alla stagione.

In secondo luogo, abbiamo quantificato la variazione dei volumi di ricerca associati alla pandemia calcolando la variazione percentuale della frequenza di ricerca per ciascun argomento rispetto alla stessa settimana 1 anno prima per il periodo dal 1 gennaio 2020 al 31 dicembre 2020. Allo stesso modo abbiamo stimato la variazione nei tassi di visite al pronto soccorso per sintomi di salute mentale e tentativi di suicidio da parte dell’NSSP.

In terzo luogo, abbiamo calcolato i coefficienti di correlazione di Pearson a coppie tra misure contemporanee derivate da SSD, NSSP e HPS. I risultati non erano sostanzialmente diversi quando si utilizzavano i coefficienti di correlazione di Spearman piuttosto che di Pearson. Abbiamo inoltre utilizzato grafici a dispersione per visualizzare in modo più approfondito la relazione tra coppie specifiche di marcatori. Nelle analisi di sensibilità abbiamo considerato il potenziale per la presenza di un ritardo di 1 o 2 settimane tra il cambiamento nei volumi di ricerca e il cambiamento nei tassi di visite al pronto soccorso per salute mentale o tentativo di suicidio. In particolare, abbiamo utilizzato un modello lineare generalizzato con una funzione di collegamento al registro per quantificare la variazione relativa nelle visite al pronto soccorso associate alle ricerche della stessa settimana, della settimana precedente e di 2 settimane prima. Adattiamo modelli separati per ogni concetto di ricerca. Tutte le analisi sono state condotte utilizzando R (versione: 4.0.2). Il codice per replicare queste analisi è disponibile pubblicamente tramite GitHub all’indirizzo https://github.com/anthonysun95/Google_SSD_and_Mental_Health.

Leave a Comment

Your email address will not be published. Required fields are marked *