Wat is Matrix Factorization?
Een techniek om grote datatabellen op te splitsen in kleinere, handiger tabellen — zodat je patronen kunt ontdekken en voorspellingen kunt doen over ontbrekende informatie.

Wat is Matrix Factorization eigenlijk?
Stel je voor: je hebt een enorme Excel-tabel met duizenden rijen en kolommen. Elke cel bevat een waarde — bijvoorbeeld hoeveel sterren iemand aan een film heeft gegeven, of hoe vaak een klant een product heeft gekocht. Maar heel veel cellen zijn leeg: niet iedereen heeft alles beoordeeld.
Matrix Factorization is een trucje om die grote tabel op te knippen in twee of meer kleinere tabellen. Door die kleinere tabellen slim met elkaar te vermenigvuldigen, kun je de ontbrekende waardes in de originele tabel voorspellen. Het is alsof je een puzzel hebt waarvan stukjes ontbreken, en je die stukjes terug kunt raden door te kijken naar de patronen in de stukjes die je wél hebt.
De kracht zit 'm erin dat die kleinere tabellen de verborgen patronen bevatten. Bij films bijvoorbeeld: de ene kleinere tabel bevat welke films bij elkaar horen (actiefilms, drama's, comedies), de andere bevat welke kijkers van welk soort films houden. Door die twee te combineren, kun je voorspellen welke film jij waarschijnlijk leuk vindt — ook al heb je hem nog niet gezien.
Hoe werkt het in de praktijk?
Laten we het concreet maken met Netflix. Je hebt een tabel met miljoenen gebruikers (rijen) en duizenden films (kolommen). De meeste mensen hebben maar een handjevol films beoordeeld, dus de tabel zit vol met lege plekken.
Matrix Factorization splitst die tabel op in twee kleinere:
Tabel A: elke gebruiker krijgt een profiel van een paar kenmerken (bijvoorbeeld: houdt van actie, houdt van romantiek, houdt van oude films)
Tabel B: elke film krijgt ook zo'n profiel (bijvoorbeeld: is een actiefilm, heeft romantiek, is een klassieker)
Door die profielen met elkaar te vermenigvuldigen, kun je voor elke combinatie van gebruiker en film voorspellen: hoeveel sterren zou deze persoon deze film geven? Zo vul je de lege plekken in.
Het slimme is dat de computer die profielen zelf ontdekt — jij hoeft niet van tevoren te bedenken wat "actie" of "romantiek" betekent. De patronen komen vanzelf uit de data.
Waarom zou jij hier iets aan hebben?
Matrix Factorization is de motor achter aanbevelingssystemen. Elke keer dat een platform zegt "dit vind je misschien ook leuk", is de kans groot dat er een vorm van Matrix Factorization achter zit.
Maar het gaat verder dan entertainment:
E-commerce: welke producten passen bij jouw koopgedrag?
Recruitment: welke kandidaat past het best bij een vacature?
Marktonderzoek: welke klanten lijken op elkaar?
Financiën: welke aandelen bewegen samen?
De techniek is compact en snel — je hoeft niet door miljoenen datapunten te zoeken, maar werkt met die kleinere tabellen. Dat maakt 'm ook toepasbaar voor bedrijven zonder enorme rekenkracht.
Een voorbeeld uit het dagelijks leven
Denk aan Spotify. Je hebt 200 nummers een like gegeven, maar Spotify heeft miljoenen tracks. Hoe weet het wat jij verder nog mooi vindt?
Door Matrix Factorization ontdekt Spotify dat jouw luistergedrag lijkt op dat van andere mensen die van indie-folk houden, maar ook af en toe jazz luisteren. Die "verborgen smaakprofielen" zitten in die kleinere tabellen. Spotify vermenigvuldigt jouw profiel met de profielen van alle nummers, en voilà: een afspeellijst op maat.
Het grappige is dat die profielen niet eens menselijk leesbare labels hebben. Het is gewoon: "jij scoort 0,8 op dimensie 3 en 0,2 op dimensie 7". De computer weet niet dat dat "indie-folk" heet — maar het werkt wel.
Waar kom je het tegen?
Matrix Factorization zit verweven in allerlei systemen:
Streamingdiensten (Netflix, Spotify, YouTube) voor aanbevelingen
E-commerce platforms (bol.com, Amazon) voor "anderen kochten ook"
Sociale media (LinkedIn, Facebook) voor "mensen die je misschien kent"
Machine learning-toolkits zoals Scikit-learn, TensorFlow, Surprise (Python-library speciaal voor recommender systems)
Databanken en analytics-tools (Google BigQuery ML, Amazon Personalize)
Ook in wetenschappelijk onderzoek: bijvoorbeeld om patronen in genetische data te vinden, of om grote datasets te comprimeren zonder belangrijke informatie te verliezen.
Wat kun je er nu mee?
Als je een bedrijf hebt met klanten en producten, kun je Matrix Factorization inzetten om slimmere aanbevelingen te doen — zonder dat je hoeft te begrijpen waaróm mensen bepaalde dingen kopen. De data vertelt het verhaal.
Voor data-analisten en marketeers: het is een krachtige manier om segmenten te ontdekken die je niet van tevoren had bedacht. Wie had gedacht dat mensen die luiers kopen ook bier kopen? De kleinere tabellen laten dat vanzelf zien.
En als je nieuwsgierig bent naar hoe aanbevelingen werken: nu weet je het. Het is niet magie — het is wiskunde die patronen zoekt in wie wat leuk vindt, en die patronen gebruikt om gaten op te vullen.
Veelgestelde vragen over Matrix Factorization
De drie meest gestelde vragen over dit onderwerp, kort beantwoord.
Wat is Matrix Factorization?
Een techniek om grote datatabellen op te splitsen in kleinere, handiger tabellen — zodat je patronen kunt ontdekken en voorspellingen kunt doen over ontbrekende informatie.
Waarom is Matrix Factorization belangrijk?
Stel je voor: je hebt een enorme Excel-tabel met duizenden rijen en kolommen. Elke cel bevat een waarde — bijvoorbeeld hoeveel sterren iemand aan een film heeft gegeven, of hoe vaak een klant een product heeft gekocht. Maar heel veel cellen zijn leeg: niet iedereen heeft alles beoordeeld.
Hoe wordt Matrix Factorization toegepast?
Matrix Factorization is een trucje om die grote tabel op te knippen in twee of meer kleinere tabellen. Door die kleinere tabellen slim met elkaar te vermenigvuldigen, kun je de ontbrekende waardes in de originele tabel voorspellen. Het is alsof je een puzzel hebt waarvan stukjes ontbreken, en je die stukjes terug kunt raden door te kijken naar de patronen in de stukjes die je wél hebt.