Machine learning in de audit: uitschieters bij vastgoedwaardering
door Koen Derks
Het doel van machine learning is om voorspellingen te maken aan de hand van data. Binnen dit veld worden doorgaans drie hoofdtoepassingen onderscheiden: classificatie, regressie en clusteren. In de eerste column is classificatie behandeld. Deze column gaat over regressie.
Regressie is een vorm van machine learning, waarmee je een numerieke uitkomst kunt voorspellen op basis van een aantal kenmerken. Dit kun je in een audit bijvoorbeeld gebruiken om de dagelijkse omzet van een winkel te voorspellen op basis van het aantal klanten en de locatie van de winkel, of om de loonkosten te voorspellen op basis van het aantal werknemers en de gewerkte uren. Zo kun je een inschatting maken of de gerapporteerde geldbedragen overeenkomen met realistische verwachtingen.
Tijdens de opleiding tot accountant leer je over lineaire regressie, maar machine learning biedt de mogelijkheid ook meer complexe verbanden te modelleren. In deze column zal ik het gebruik van het zogenoemde boosting algoritme gebruiken als voorbeeld, hoewel er tal van andere algoritmes beschikbaar zijn.
[....]