Machine learning algoritmes bewijzen hun nut bij het verdelen van zorggeld
Algoritmes zijn niet meer weg te denken uit ons leven: van gerichte aanbiedingen van de supermarkt tot ondersteuning bij het stellen van medische diagnoses. Onlangs hebben Gupta Strategists en i2i, in opdracht van het ministerie van VWS, een nieuwe toepassing van algoritmes binnen het zorgsysteem verkend. En wat blijkt? Ook bij het voorspellen van zorgkosten zijn machine learning algoritmes van waarde.
Voorspelling van zorgkosten cruciaal in Nederlands zorgsysteem
De zogenaamde ‘risicoverevening’ is niet weg te denken uit het Nederlandse zorgstelsel. Sterker nog, wereldwijd geldt ons vereveningssysteem als hét systeem om solidariteit in de zorg mogelijk te maken. In het kort komt het erop neer dat zorgverzekeraars financieel gecompenseerd worden voor de zorgbehoefte van hun verzekerden. Die bijdrage is gebaseerd op de voorspelde zorgkosten per persoon. Zo krijgt een verzekeraar met vooral ouderen met een slechte gezondheid een hogere bijdrage dan een verzekeraar met veel gezonde jongeren. Zonder risicoverevening zouden (chronisch) zieke mensen zeer hoge premies moeten betalen of onverzekerbaar worden.
Aantoonbaar betere voorspelling met machine learning
Uit ons onderzoek ‘Machine Learning in de Risicoverevening’ blijkt dat toepassing van machine learning algoritmes de voorspelling van zorgkosten aanzienlijk beter maakt. Dit onderzoek voerden we in opdracht van het ministerie van VWS uit samen met experts van i2i. In het onderzoek laten we zien dat met machine learning de voorspelde zorgkosten dichter bij de werkelijke kosten liggen dan met het huidige vereveningssysteem. Om precies te zijn: de voorspelling is ruim 3-procentpunt beter, gemeten in R2. We konden de spreiding tussen verzekeraars terugbrengen van 310 euro per verzekerde naar 235 euro.
Voor- en nadelen van verschillende algoritmes
In het onderzoek hebben we verschillende machine learning algoritmes vergeleken. Het neuraal netwerk en het GBM-algoritme presteerden het best. De voorspelkracht van beide algoritmes was aanzienlijk beter dan van de klassieke lineaire regressie. Dat komt omdat we met machine learning beter in staat zijn de interacties tussen verschillende verzekerdenkenmerken – zoals leeftijd, chronische aandoeningen en sociaaleconomische status – te ‘vangen’. De algoritmes hebben helaas ook nadelen, bijvoorbeeld qua uitlegbaarheid van de resultaten en benodigde rekenkracht. Ook vragen ze aanpassingen aan de huidige werkwijze. In het onderzoek beschrijven we uitvoerig hoe de verschillende algoritmes werken, welke resultaten ze opleveren en welke voor- en nadelen ze hebben. Ook is de broncode beschikbaar.
Meer weten over toepassing van machine learning in de zorg?
Neem contact op met Roxanne Busschers of Daan Livestro.
Download hier de studie: "Machine Learning in de Risicoverevening" » Download the full report "Exploring the use of machine learning in health insurance risk adjustment" »