Kan Artificial Intelligence het succes van psychiatrische behandelingen voorspellen?
Kan een hersenscan bepalen welke therapie het beste is bij een psychiatrische aandoening? Jazeker, wel als je heel veel data hebt en je laat er artificial intelligence op los. Prof. dr. Guido van Wingen, als hoogleraar neuro-imaging in de psychiatrie verbonden aan Amsterdam UMC, doet al tien jaar onderzoek naar het inzetten van kunstmatige intelligentie bij het voorspellen van succesvolle behandelingen. De methode heeft zich al bewezen. Nu wordt het tijd voor een klinische toepassing, zo betoogt hij. Maar de praktijk is weerbarstig.
Guido van Wingen publiceerde het betoog in april van dit jaar in zijn artikel ‘Kunstmatige intelligentie voor klinische toepassing van beeldvorming in de psychiatrie’ dat in bewerkte versie is opgenomen in het Nederlands Tijdschrift voor Geneeskunde. Hij laat zien wat de potentie is van AI en machine learning in het voorspellen van het succes van behandelingen voor met name depressies. Het lijkt een veelbelovende methode, maar nu moet de belofte worden waargemaakt in ziekenhuizen en GGZ-instellingen. Dat kan veel kosten voor onnodige behandeling schelen. Maar wie wil de investering doen? De opschaling van de ontwikkeling bevindt zich in een vacuüm, zo vertelt Van Wingen aan GGZTotaal.
“In de psychiatrie en in de geneeskunde in het algemeen bestond een behandeling uit een soort van ‘trial and error’. Patiënten krijgen als eerste de behandeling die het goedkoopst en het snelst is en als die niet werkt gaan we door naar de volgende behandeling. En werkt dat niet, dan weer door naar de volgende. Die hele manier van behandelen is niet voor niks gekozen, dat is omdat we op voorhand niet weten welke patiënt baat heeft bij welke behandeling. We kunnen niet meteen behandeling op maat aanbieden. Dat is dus eigenlijk een zwaktebod”, zegt Van Wingen. Dat kan anders. “Het keerpunt is dat we enerzijds informatie van hersenfuncties kunnen verzamelen door middel van EEG of MRI, en anderzijds dat we die data kunnen analyseren met kunstmatige intelligentie. Bij verschillende behandelingen in verschillende onderzoekscentra blijkt dat we dan met tachtig procent zekerheid kunnen voorspellen of het succesvol is of niet. Dat is vergelijkbaar met de covid-zelftesten van nu, die hebben ook tachtig procent sensitiviteit. Dus kun je vier van de vijf gevallen correct detecteren. Bij die zelftesten is het referentiekader de PCR-test. Die pakt ongeveer 99 procent. Het referentiekader binnen de psychiatrie is ongeveer vijftig procent. De helft. Dan kan je zeggen: we weten het gewoon niet. In de psychiatrie kunnen clinici niet aan de hand van vragenlijsten voorspellen, maar aan de hand van beeldvormend materiaal lukt het best goed.”
Maar wat zie je dan aan de hersenen als je dat doet?
“Nou, eigenlijk niks. Al een aantal decennia was er de hoop dat beeldvormend onderzoek binnen de psychiatrie voor een doorbraak zou zorgen doordat we ineens konden zien wat er mis wat met een patiënt. Dat bleek allemaal niet te kloppen. Er zijn hele grote studies opgetuigd en we kunnen voor de gemiddelde patiënt zien wat er anders is. Onderzoekstechnisch is dat misschien interessant, maar voor klinische zorg heb je er niks aan. Daarvoor komt de benadering met artificial intelligence om de hoek kijken. In plaats van dat je gewoon naar een plaatje kijkt, gebruikt de computer met een algoritme alle data tegelijk. Wij kunnen ons een tweedimensionaal beeld nog wel voorstellen, dan zien we mooie plaatjes. Driedimensionaal wordt al lastig in een grafiek en met de vierde dimensie wordt het al vrij onmogelijk. En in een computer gebruiken we gewoon honderdduizend dimensies tegelijk. Daar kunnen we ons natuurlijk helemaal geen voorstelling van maken. Voor een computer maakt dat helemaal niet uit. Die gebruikt alle data tegelijk om een voorspelling te doen. Voordeel is dat we nu heel goed weten dát het kan, nadeel is dat we niet goed weten waaróm het kan. Dat is de keerzijde van de medaille.”
“Er komt geen beeld uit, maar een klinisch oordeel. We kúnnen wel plaatjes maken, maar die zijn eigenlijk heel misleidend. Daar staan dan alle datapunten in die een algoritme heeft gebruikt, maar de computer heeft niet de algoritmes per waarde gebruikt maar alle waarden gecombineerd. Dat kun je onmogelijk visualiseren. Er zijn wel technieken om informatie uit bepaalde hersengebieden weg te laten en dan te kijken of een voorspelling nog klopt. Op die manier kun je een beetje achterhalen welke hersengebieden belangrijk zijn bij een bepaald proces. Maar voor een goede voorspelling heb je alles nodig. Zo’n voorspelling is voor elk individu verschillend. De computer detecteert wel gemiddelde patronen, maar doordat ‘ie alle data tegelijk gebruikt is het systeem sensitief om uitspraken te doen voor individuele patiënten.”
Wat vinden psychologen en psychiaters van deze methode?
“Behandelaars kijken wisselend aan tegen deze AI-toepassing. Enerzijds vinden ze het fantastisch dat we nu het succes van een behandeling wel kunnen voorspellen, anderzijds zijn ze deze manier van werken helemaal niet gewend. In die zin is de psychiatrie wel een heel ander specialisme dan andere vakgebieden waar artsen altijd al patiënten naar radiologie sturen voor bijvoorbeeld röntgen of een MRI. Psychologen en psychiaters zijn gewend om altijd op hun eigen oordeel te kunnen varen, omdat ze nooit externe onderzoeksmogelijkheden hebben gehad. Dus dat wordt een spannende transitie straks. De behandelaars die de methode gebruiken zijn enthousiast. Ze troeven hun collega’s meteen af, met een methode die voor tachtig procent succesvol voorspelt. Er is een klinische studie in een GGZ-instelling gedaan, daar zegt de organisatie: we gaan niet meer terug, we kunnen onze patiënten dit niet onthouden. Het vergt wel een extra investering. Een MRI bedraagt voor ongeveer 300 euro aan ziekenhuiskosten. Voor een EEG heb je in ieder geval een half uur assistentie nodig. Maar die investering valt in het niet bij de kosten voor een onnodige behandeling. Die is vele malen duurder. Als je er van uitgaat dat gemiddeld zo’n veertig procent van de patiënten baat hebben bij een behandeling, dan hou je zestig procent over die er geen baat bij hebben. Als je dat kunt terugbrengen met die tachtig procent aan goede behandelingen, dan hou je maar twintig procent van de patiënten over die geen baat hebben bij een behandeling. Tel uit je winst.”
“Het belang wordt ook wel breed erkend, hoor. De Nederlandse Vereniging voor Psychiatrie en de federatie van psychologen, psychotherapeuten en pedagogen P3NL hebben het personaliseren van behandeling hoog op de agenda staan. Dat is niet zo gek, want het is binnen de geneeskunde in alle vakgebieden buiten de psychiatrie ook een speerpunt.”
Is de methode voor alle psychische aandoeningen toepasbaar?
“In principe wel, maar per aandoening moet het natuurlijk effectief bewezen worden. Dat is het geval bij mijn onderzoeken, die richten zich vooral op depressie, OCD, angststoornissen en PTSS. Binnen het Radboudumc wordt naast OCD gekeken naar ADHD en ASD. Wij onderzochten de voorspelbaarheid van behandelingen. Daarnaast wordt er veel onderzoek gedaan naar schizofrenie, waarbij wordt gekeken of patiënten een stoornis ontwikkelen nadat ze de eerste keer binnenkomen met een psychose. Daarvoor blijkt AI ook goed te werken. In het algemeen weten we dat het verschil tussen psychiatrische patiënten en ‘gewone’ mensen lang niet zo groot is als de verschillen tussen patiënten onderling. Dat lijkt gerelateerd aan de individuele bevattelijkheid voor behandeling. Met dat idee in het achterhoofd durf ik te stellen dat kunstmatige intelligentie mogelijk ook voor alle andere aandoeningen van toepassing zou kunnen zijn. Maar dat moet uiteraard nog onderzocht worden.”
De volgende stap is om dit op grote schaal toe te passen?
“Ja, we zitten nu in de fase waarin we de stap moeten maken van experimenteel onderzoek naar klinische toepassing. Daarvoor moet het onderzoek groter zijn, waarbij een representatieve groep van patiënten gaat deelnemen in plaats van alleen een speciaal geselecteerde onderzoeksgroep. Cruciaal voor een kunstmatige intelligentie is: een algoritme is zo goed als de data die erin gaat. Daarom moeten we nu studies doen waarin alle verschillende GGZ-patiënten evenredig vertegenwoordigd zijn. Pas dan kunnen we kijken of een algoritme voor alle patiënten een goede voorspelling kan geven en kan worden toegepast in de klinieken. We zijn nu bezig een nationaal consortium op te richten, waarin GGZ-instellingen, perifere en academische ziekenhuizen samenwerken en patiënten gaan werven om in ieder geval voor depressie een representatieve groep te krijgen. Maar we hebben budget nodig om op grote schaal onderzoek te doen.”
Wie moet de stap van onderzoek naar praktijk financieren?
“Dat is goede vraag. Farmaceuten willen het niet. Zij kunnen hier geen product van verkopen. De enigen die er uiteindelijk baat bij zullen hebben, zijn de zorgverzekeraars, want er zullen veel minder onnodige behandelingen plaatsvinden. Maar verzekeraars financieren de ontwikkeling niet. Zij zeggen: als het er eenmaal is en bewezen is dat het werkt, dan gaan we het implementeren. Dus we zitten nu eigenlijk een beetje in een vacuüm. We hebben grote budgetten nodig om op te schalen. Als het nodig is, dan kan het heel snel gaan. Dat zie je aan de covid-vaccins. Maar voor een ontwikkeling binnen de GGZ is dat blijkbaar best lastig.”
“Ik heb geen idee hoe lang het gaat duren voordat deze methode erkend is, en dus verzekerde zorg gaat worden. Ik kan alleen maar mijn hoop uitspreken. Bij geneesmiddelenonderzoek duurt het vaak vijftien à twintig jaar. Wij kunnen best al wat stappen overslaan omdat we geen nieuwe middelen hoeven te ontwikkelen of te testen of ze veilig zijn. We kunnen dus meteen naar het eindstadium van het onderzoek. Dus ik hoop dat we binnen vijf jaar duidelijk hebben of dit goed genoeg werkt voor klinische implementatie. En dan zou het heel snel kunnen gaan. Als we er over tien jaar zijn, dan ben ik blij.”
Lees hier andere artikelen over kunstmatige intelligentie in de ggz