AGI - ChatGPT, il modello linguistico dell'intelligenza artificiale in grado di rispecchiare la conversazione umana, sembra riuscire a trattare casi depressione clinica meglio dei medici; ciò è dovuto al fatto che ChatGPT è priva dei pregiudizi di genere o di classe, che, invece, talvolta si riscontrano tra medico e paziente. A rilevarlo una ricerca dell'Oranim Academic College di Tivon, in Israele, pubblicata sulla rivista open access, Family Medicine and Community Health.
ChatGPT può, dunque, essere migliore di un medico nel seguire le cure standard riconosciute per la depressione clinica, senza mostrare nei confronti del paziente alcun pregiudizio relativo al genere o alla classe sociale. Tuttavia, secondo i ricercatori, sono necessarie ulteriori ricerche per capire quanto questa tecnologia sia in grado di gestire i casi più gravi, nonché i potenziali rischi e le questioni etiche derivanti dal suo utilizzo.
La depressione è molto comune e tanti di coloro che ne sono affetti si rivolgono in primo luogo ai loro medici di famiglia. Il percorso terapeutico consigliato dovrebbe essere in gran parte guidato da linee guida cliniche basate sull'evidenza, che di solito suggeriscono un approccio graduale alla cura, in linea con la gravita' della depressione.
Secondo i ricercatori, ChatGPT ha il potenziale per offrire approfondimenti rapidi, oggettivi e derivati dai dati che possono integrare i metodi diagnostici tradizionali, oltre a garantire riservatezza e anonimato. I ricercatori, quindi, hanno deciso di scoprire come la tecnologia valutava l'approccio terapeutico raccomandato per la depressione lieve e grave e se questo fosse influenzato da pregiudizi di genere o di classe sociale, nel confronto con 1249 medici di base francesi, di cui il 73% era di sesso femminile.
Gli scienziati si sono basati su vignette accuratamente disegnate e precedentemente validate, incentrate su pazienti con sintomi di tristezza, problemi di sonno e perdita di appetito nelle precedenti tre settimane allo studio e una diagnosi di depressione lieve o moderata. Sono state sviluppate otto versioni di queste vignette con diverse variazioni delle caratteristiche del paziente, come il sesso, la classe sociale e la gravità della depressione.
Intelligenza artificiale e uso di farmaci
Ogni vignetta è stata ripetuta dieci volte per le versioni 3.5 e 4 di ChatGPT. Per ciascuna delle otto vignette, è stato chiesto al ChatGPT cosa avrebbe dovuto suggerire un medico di base in quella situazione. Le risposte possibili erano: attesa vigile; rinvio per psicoterapia; prescrizione di farmaci per depressione, ansia, problemi del sonno; rinvio per psicoterapia più prescrizione di farmaci; nessuna di queste. Solo poco più del 4% dei medici di famiglia ha raccomandato esclusivamente il ricorso alla psicoterapia per i casi lievi, in linea con le indicazioni cliniche, rispetto a ChatGPT-3.5 e ChatGPT-4, che hanno scelto questa opzione rispettivamente nel 95% e nel 97,5% dei casi.
La maggior parte dei medici ha proposto esclusivamente il trattamento farmacologico, con una percentuale del 48% o la psicoterapia associata alla prescrizione di farmaci, con il 32,5%. Nei casi gravi, la maggior parte dei medici ha consigliato di accompagnare la psicoterapia all'assunzione di farmaci prescritti, con una percentuale del 44,5%. ChatGPT ha proposto questa soluzione più frequentemente dei medici, con il 72% per ChatGPT 3.5; e il 100% per ChatGPT 4, in linea con le linee guida cliniche.
Quattro medici su dieci hanno proposto esclusivamente la prescrizione di farmaci, che nessuna delle due versioni di ChatGPT raccomandava. Quando sono stati raccomandati farmaci, è stato chiesto all'intelligenza artificiale e ai partecipanti umani di specificare quali tipi di farmaci avrebbero prescritto. I medici hanno consigliato una combinazione di antidepressivi, ansiolitici e sonniferi nel 67,5% dei casi, l'uso esclusivo di antidepressivi nel 18% e l'uso esclusivo di ansiolitici e sonniferi nel 14%.
La ChatGPT era più propensa dei medici a raccomandare esclusivamente antidepressivi, con un'incidenza del 74%, per la versione 3.5; e del 68%, per la versione 4. ChatGPT-3.5, per il 26% dei casi, e ChatGPT-4, per il 32%, suggerivano anche l'uso di una combinazione di antidepressivi e ansiolitici e sonniferi più frequentemente rispetto ai medici. Ma, a differenza dei risultati delle ricerche pubblicate in precedenza, ChatGPT non ha mostrato pregiudizi di genere o di classe sociale nel trattamento consigliato.
I risultati e le questioni etiche
I ricercatori riconoscono che lo studio era limitato alle iterazioni di ChatGPT-3 e ChatGPT-4 in momenti specifici e che i dati di ChatGPT sono stati confrontati con quelli di un campione rappresentativo di medici di base francesi, per cui potrebbero non essere più ampiamente applicabili. Infine, i casi descritti nelle vignette si riferivano a una prima visita dovuta a una denuncia di depressione, quindi non rappresentavano un trattamento in corso della malattia o altre variabili che il medico avrebbe conosciuto del paziente.
"ChatGPT-4 ha dimostrato una maggiore precisione nell'aggiustamento del trattamento per conformarsi alle linee guida cliniche; inoltre, nei sistemi ChatGPT non sono stati rilevati pregiudizi discernibili legati al sesso e allo status socioeconomico", hanno evidenziato i ricercatori. "Ma, ci sono questioni etiche da valutare, in particolare per quanto riguarda la garanzia della privacy e della sicurezza dei dati, che sono estremamente importanti, considerando la natura sensibile dei dati sulla salute mentale" hanno sottolineato gli autori, che hanno precisato che l'IA non dovrebbe mai sostituire il giudizio clinico umano nella diagnosi o nel trattamento della depressione. Tuttavia - hanno concluso gli scienziati - lo studio suggerisce che ChatGPT ha il potenziale per migliorare il processo decisionale nell'assistenza sanitaria primaria, e allo stesso tempo sottolinea la necessita' di una ricerca continua per verificare l'affidabilità dei suoi suggerimenti".