Met behulp van machine learning-algoritmes kunnen Nederlanse onderzoekers vroegtijdig voorspellen of een patiënt een verhoogd risico loopt om hartfalen te ontwikkelen.
Hartfalen is een veelvoorkomende aandoening met ernstige gevolgen; meer dan 20% van de patiënten overlijdt binnen een jaar na de diagnose. Met behulp van machine learning-algoritmes, waarbij gebruik gemaakt wordt van data uit elektronische patiëntendossiers van huisartsen, kunnen onderzoekers vroegtijdig voorspellen of een patiënt een verhoogd risico loopt om hartfalen te ontwikkelen. Dit maakt gericht preventief ingrijpen mogelijk, waardoor wellicht ernstige schade kan worden voorkomen of uitgesteld. Het onderzoek werd uitgevoerd door het Nederlands onderzoeksinstituut Nivel in samenwerking met de Vrije Universiteit Amsterdam en gepubliceerd in de BMJ Open.
In het onderzoek werden zorgdata gebruikt van patiënten bij wie de diagnose hartfalen door de huisarts werd gesteld. Met de inzet van een speciaal hiervoor ontwikkeld machine learning-model konden de patiënten een jaar eerder herkend worden als ‘patiënten met verhoogd risico op hartfalen’ dan het moment waarop de huisarts die diagnose stelde. Dit is een aanzienlijke tijdwinst en zorgt ervoor dat een vervolgstap in het zorgtraject, het vroegtijdig screenen van de patiënt, kan worden ingezet.
De onderzoekers gebruikten data uit Nivel Zorgregistraties Eerste Lijn, waarin de zorgdata worden verzameld die zo’n 370 huisartsenpraktijken routinematig vastleggen in hun patiëntendossiers. Dit heeft twee voordelen: een grote hoeveelheid data, een voorwaarde voor betekenisvol gebruik van het ontwikkelde machine learning-model. Ten tweede konden de onderzoekers door gebruik van reeds verzamelde data extra belasting voor patiënt en huisarts voorkomen; het was immers niet nodig om een patiënt en huisarts actief te benaderen voordat ze een voorspelling konden doen over verhoogd risico op hartfalen. Dit is ook voor de toekomst van belang bij screening: men kan een selectie van patiënten met een verhoogd risico maken zonder deze patiënten eerst op te roepen. Hiervoor is echter nog wel verdere validatie van het model nodig.
Drie algoritmen
In de studie werd de mogelijkheid onderzocht om hartfalen één jaar voor de diagnose te voorspellen aan de hand van de gegevens in de elektronische patiëntendossiers van patiënten boven de 70 jaar, verzameld in de periode 2012-2019. Deze data betreffen de consultinformatie, medicatie, demografische gegevens en labwaardes. Voor de analyse werden drie verschillende machine learning-algoritmes gebruikt: logistische regressie, random forest en XGBoost. Bij de gegevens uit het elektronische patiëntendossier werd als extra informatie de volgorde van informatie meegenomen. De incidentie van patiënten met hartfalen in het onderzoek was gelijk aan de incidentie in de praktijk. Hierdoor is het waarschijnlijker dat de resultaten vertaalbaar zijn naar de praktijk.