RBI-Solutions blog

Van tijd naar trigger: De weg naar een event-driven data architectuur

Sinds het begin van het gebruik van Business Intelligence hebben organisaties vertrouwd op periodieke dataverwerking, de zogenaamde ’batch jobs’ die elke nacht draaien. Sindsdien is de behoefte aan snelheid, flexibiliteit en realtime inzichten enorm toegenomen. Die behoefte zorgt dan ook voor een fundamentele verschuiving in hoe we data-architecturen ontwerpen: weg van batch processen, op weg naar een event-driven benadering. Maar wat betekent dat eigenlijk: ’event-driven’? En waarom zou je hier als data engineer, analist, data scientist of business gebruiker wakker van moeten liggen? In deze blog duiken we in de wereld van event-driven data-architecturen, hun voordelen, uitdagingen, en de tools die deze transitie mogelijk maken.


Van batch naar event: waarom we moeten bewegen
Traditioneel verwerken veel organisaties hun data in batches. Denk aan een datateam dat elke ochtend verse rapportages en verantwoordingslijsten levert op basis van data die ‘s nachts is ingeladen uit verschillende bronsystemen. Dit werkt, tot op zekere hoogte. Maar in een tijd waarin klanten realtime updates verwachten, systemen continu met elkaar communiceren en beslissingen steeds sneller genomen moeten worden, begint de batch-benadering te piepen en te kraken.

Een klassiek voorbeeld vinden we binnen de klantenservice. Stel je voor: een klant belt met een klacht over een levering. Ondertussen is de retourzending van datzelfde product al onderweg, maar die informatie zit nog opgesloten in een systeem dat pas ’s nachts wordt gesynchroniseerd met het CRM. Het gevolg: de klantenservicemedewerker ziet verouderde data, biedt verkeerde oplossingen aan en de klant raakt gefrustreerd door tegenstrijdige informatie.

Met een event-driven architectuur zou elke stap in dat retourproces direct als event beschikbaar zijn, van het aanmelden van een retour tot het scannen van het pakket in het distributiecentrum. De medewerkers beschikken zo over realtime inzicht in wat er speelt, wat resulteert in snellere, correctere hulp en een veel betere klantbeleving. De data stroomt hier niet meer via tijdsvensters, maar volgt het pad van de interactie zelf.

Wat is een event-driven data architectuur precies?
Een event-driven architectuur is gebaseerd op het idee dat systemen reageren op gebeurtenissen, oftewel ‘events’. Een event kan van alles zijn: een nieuwe transactie, een wijziging in klantgegevens, een foutmelding of zelfs een sensor die een waarde doorstuurt. In plaats van data periodiek op te halen of te pushen, publiceert een systeem een event zodra er iets relevants gebeurt. Andere systemen (of data pipelines) die geïnteresseerd zijn in dat event kunnen daarop abonneren en meteen reageren.

Deze manier van werken creëert een veel dynamischer datalandschap, waarin de afhankelijkheden tussen systemen minder strak zijn en de verwerkingssnelheid drastisch toeneemt. Systemen zoals Apache Kafka, Pulsar, AWS Kinesis en Azure Event Hubs spelen hier een sleutelrol: ze fungeren als centrale event brokers die zorgen voor schaalbare, betrouwbare en snelle eventdistributie.

De technische onderbouwing: hoe werkt het onder de motorkap?
In een event-driven architectuur zijn drie componenten cruciaal: producers, brokers en consumers.

  • De producer genereert een event, bijvoorbeeld een API die een bestelling plaatst.
  • De broker ontvangt het event en bewaart het op een robuuste manier, klaar om verspreid te worden. Apache Kafka is hier waarschijnlijk het meest bekende voorbeeld van. Kafka zorgt ervoor dat events gelogd, opgeslagen en eventueel later opnieuw afgespeeld kunnen worden.
  • De consumer luistert naar de broker en verwerkt het event zodra het beschikbaar is. Dit kan een data pipeline zijn die het event opslaat in een datalake, of een analytics engine die het event verrijkt en gebruikt voor dashboards of machine learning.

Tools zoals dbt Cloud, Airbyte, Fivetran en Dagster bewegen mee in deze richting en bieden steeds meer ondersteuning voor event-gedreven architecturen. Ze integreren met streamingdiensten of ondersteunen hybride vormen waarin batch en event-driven combineren.

Uitdagingen en valkuilen: het is niet alleen maar winst
Hoewel de voordelen overtuigend zijn, is de overstap naar een event-driven architectuur niet zonder uitdagingen. Ten eerste vraagt het een andere manier van denken. Data is niet langer iets wat je op gezette tijden ‘ophaalt’, maar iets dat zich continu aandient. Dit vereist herziening van hoe pipelines worden ontworpen, getest en gemonitord.

Daarnaast is data-consistentie een heet hangijzer. Hoe zorg je ervoor dat events in de juiste volgorde worden verwerkt, vooral wanneer systemen veranderen? En hoe voorkom je dat dubbele events leiden tot foutieve analyses of acties?

Een andere uitdaging is governance. In een omgeving waarin events real-time verwerkt worden, moet je goed nadenken over metadata, lineage en toegangscontrole. Tools zoals Apache Atlas of OpenLineage kunnen hierbij helpen, maar vragen om volwassen implementatie en een sterke basis in Data Governance.

Tot slot is er de culturele component: niet elk team is klaar voor de snelheid en verantwoordelijkheid die met een event-driven aanpak gepaard gaat. Het vraagt om cross-functionele samenwerking, discipline en een sterke focus op observability.

Best practices en trends: hoe pak je het slim aan?
Wie de overstap wil maken, doet er goed aan om klein te beginnen. Kies één proces waar realtime voordelen evident zijn; denk aan klantinteractie, incidentmonitoring of voorraadbeheer en bouw daaromheen een pilot. Maak gebruik van bestaande event brokers, zoals Kafka (open-source of via Confluent Cloud), en gebruik frameworks als Kafka Streams of Flink voor verwerking. Richt observability direct goed in: tools zoals Grafana, Prometheus of OpenTelemetry kunnen je enorm helpen in het beheersbaar houden van je data-pipelines.

Hybride architecturen zijn een andere trend. Niet alles hoeft direct event-driven te zijn. Vaak zie je combinaties waarin event streams worden opgeslagen in een data lake (zoals Delta Lake of Iceberg), zodat analisten batchgewijs kunnen blijven werken met de nieuwste data. Tegelijkertijd kunnen andere processen gebruikmaken van dezelfde events voor realtime analytics.

Conclusie: van reageren op tijd naar reageren op realiteit
De transitie van tijd gebaseerde naar event-driven data-architecturen is een logische stap in een wereld die steeds sneller en complexer wordt. Voor organisaties betekent het sneller inspelen op klantgedrag, slimmere processen en robuustere systemen. Voor data professionals betekent het nieuwe tools, nieuwe denkwijzen en een nieuwe leercurve.

Maar wie die curve aandurft, plukt snel de vruchten: wendbare data-infrastructuren die niet langer leven op de klok, maar op de polsslag van de werkelijkheid. Of, om het met een knipoog te zeggen: “In een wereld waar elke seconde telt, is wachten op middernacht ouderwets”.

Lees verder over data en de diensten van RBI-Solutions in deze blog's:

Zonder businessdoelen geen duurzame data-architectuur

Zonder businessdoelen geen duurzame data-architectuur

Vorige week gaf ik met veel enthousiasme een introductie over data-architecturen aan nieuwe collega’s. We bespraken de historie van architecturen, de plek van een Data Architectuur binnen een Enterprise Architectuur en hoe zo’n architectuur het werk van Data Engineers, Data Analisten en Data Scientists beïnvloedt. Data Architectuur wordt vaak gezien als een IT-feestje, maar een goede architectuur wordt altijd gedreven door heldere businessdoelen. Zonder die doelen is een data platform als een Ferrari bij een off-road rally: technisch en esthetisch indrukwekkend, maar totaal ongeschikt voor het terrein waarin het moet presteren. Zo verliest een architectuur zonder richting snel zijn waarde en wordt data engineering meer een technologisch experiment dan een strategisch fundament.

MCP: De nieuwe AI standaard

MCP: De nieuwe AI standaard

Een begrip dat je online steeds vaker tegenkomt binnen al de buzz rond AI is ‘MCP’; weer zo’n afkorting die voor heel veel mensen cryptisch klinkt. Binnen de AI wereld is het echter wel een heel belangrijke vooruitgang: standaardisatie. Het verbinden van AI met bestaande APIs biedt heel veel mogelijkheden. Echter bouwt elke organisatie hun oplossing net weer anders. De ene bot praat zo tegen een API, de andere weer anders, en voor je het weet heb je een kerkhof aan connectors. Het idee is goed, de uitvoering vaak rommelig. Dit is precies waar MCP om de hoek komt kijken.

AI Agents: meer dan een slimmere chatbot

AI Agents: meer dan een slimmere chatbot

De meeste mensen zien AI nog steeds als een soort papegaai die tekstjes en plaatjes maakt zodra je iets vraagt. Handig, maar ook best oppervlakkig. Sinds enige tijd is er echter ook iets nieuws in opkomst: ‘Agentic AI’. AI-agenten dus die autonoom te werk kunnen gaan.

In plaats van pure generatie, kunnen ze een probleem ontleden, stappen zetten richting een oplossing, hun eigen werk checken en zelf andere tools gebruiken. We stappen dus richting zelfstandig werkende oplossingen. Je kunt het bijna zien als een leger van volledig virtuele assistenten en stagiaires. Dit belooft veel maar, brengt zeker ook gevaren.

AutoML: Machine Learning op de automatische piloot?

AutoML: Machine Learning op de automatische piloot?

Geautomatiseerd Machine Learning ook wel ‘AutoML’ is het automatiseren van de tijdrovende, iteratieve taken bij het ontwikkelen van machine learning-modellen. Je laat als het ware het bouwen van de modellen aan de machines zelf over.

Voor een paar tientjes een model dat kan voorspellen welke klanten over een paar maanden gaan vertrekken. Klinkt een beetje te goed om waar te zijn. Dan heb je natuurlijk ook geen Data Scientists meer nodig, toch? Nou, er zitten uiteraard wel wat haken en ogen aan. De specialisten op het gebied van Machine Learning verdwijnen ook zeker niet zo maar. Even een stap terug dus.

Data mesh: principes en praktische implementatie

Data mesh: principes en praktische implementatie

Elk relatief groot bedrijf bestaat uit verschillende afdelingen, elk met zijn eigen vraagstukken. Op datagebied is dat niet anders: marketing wil weten hoe campagnes performen, operations wil de huidige voorraad kunnen inzien, finance bewaakt de cashflow en productontwikkeling volgt klantgedrag.

Datamigratie afgerond… en nu?

Datamigratie afgerond… en nu?

Binnen veel organisaties is een datamigratie een enorme mijlpaal. Maandenlang werk je toe naar dat ene moment waarop alle data succesvol is overgezet naar de nieuwe operationele applicatie. Tijdens dat migratietraject worden allerlei controles ingericht: validatieregels, datakwaliteits­checks en integriteitscontroles die ervoor zorgen dat iedere klant, transactie of productrecord correct wordt overgezet. In de praktijk zien we alleen dat die regels direct na de migratie verdwijnen uit beeld. Terwijl ze juist ook dan van grote waarde zijn.

Meggie over haar werk bij de klant

Meggie over haar werk bij de klant

Meggie van den Boom, data engineer bij RBI Solutions, werkt al anderhalf jaar als data consultant bij een financiële dienstverlener. Ze geeft ons vandaag een kijkje in hoe haar werkzaamheden binnen haar team bij de klant eruit zien.

Metadata: je geheime wapen voor observability & governance

Metadata: je geheime wapen voor observability & governance

Metadata voor observability en governance: verder dan information_schema
Een aantal weken geleden, wijdden we een blog aan het gebruik van metadata voor het slimmer ontwikkelen en onderhouden van dataplatforms. Metadata wordt helaas nog vaak gezien als het saaie bijproduct van data: een paar kolomnamen, datatypes en misschien een timestamp, maar in moderne dataplatformen is dat nog maar het topje van de ijsberg. Metadata kan, mits goed benut, een krachtig fundament vormen voor zowel observability als governance. Het kan helpen bij het opsporen van problemen, het begrijpen van datastromen, het garanderen van compliance en zelfs het optimaliseren van prestaties.

Data migratie test en validatiestrategieën: hoe je zeker weet dat je data klopt na een migratie

Data migratie test en validatiestrategieën: hoe je zeker weet dat je data klopt na een migratie

Data migraties zijn voor veel organisaties een uitdaging: je stapt over van een oud systeem naar een nieuw, je moderniseert je datawarehouse of je integreert een nieuw platform na een fusie. Ondanks dat het technisch ‘slechts’ het verplaatsen van data lijkt, komt er meer bij kijken om een goede datamigratie uit te voeren. Hoe weet je zeker dat de data na migratie nog klopt? Dat er niets verloren is gegaan, of erger nog: dat je geen subtiele fouten hebt geïntroduceerd die maanden later pas boven water komen?
In deze blog staan we stil bij test- en validatiestrategieën bij data migraties. We bespreken waarom het testen van een datamigratie fundamenteel anders is dan het testen van een standaard applicatie, welke technieken je kunt gebruiken om betrouwbaarheid te garanderen, en hoe je omgaat met de praktische uitdagingen die je onderweg tegenkomt.

Waarom AI en automatisering niet werken zonder goede data engineering

Waarom AI en automatisering niet werken zonder goede data engineering

AI is hot. Iedereen wil er iets mee. Van slimme voorspellingen tot volledige automatisering van bedrijfsprocessen; organisaties investeren massaal in artificial intelligence. Maar wie verder kijkt dan de hype, ziet dat veel AI-projecten stranden nog voordat ze echt waarde opleveren. Niet vanwege de modellen of de tooling, maar vanwege iets veel fundamentelers: de onderliggende data en hoe je ermee omgaat. Of specifieker: de data engineering erachter. Want zonder robuuste data-infrastructuur is AI net zo betrouwbaar als een kompas in een magneetveld. 

Data-APK: inzicht en zekerheid voor jouw bedrijfsdata

Data-APK: inzicht en zekerheid voor jouw bedrijfsdata

In een tijd waarin beslissingen steeds meer op data leunen, is het essentieel om zeker te weten dat die data klopt. Net als een auto die regelmatig een APK nodig heeft om veilig te blijven rijden, vraagt ook jouw bedrijfsdata om een periodieke check. Bij RBI Solutions noemen we dat de Data-APK: een slimme, laagdrempelige manier om jouw data in kaart te brengen, problemen te signaleren en waardevolle inzichten te bieden die jouw organisatie helpen sneller en beter beslissingen te nemen.

de transitie met Microsoft Fabric

de transitie met Microsoft Fabric

In veel MKB-organisaties is het verzamelen en rapporteren van data nog steeds een tijdrovende en foutgevoelige klus. Excel-bestanden circuleren overal, gegevens worden handmatig gecorrigeerd in verschillende systemen en rapportages worden met de hand bijgewerkt. Het gevolg is dat managers en analisten vaak worstelen met verouderde inzichten, inconsistente cijfers en een gebrek aan overzicht. Hierdoor duurt het langer voordat er goede beslissingen genomen kunnen worden en het vertrouwen in de data neemt af.

Een bekend probleem is dat data uit verschillende systemen, zoals een boekhoudpakket, CRM of HR-software, niet automatisch met elkaar verbonden zijn. Dit leidt tot dubbel werk, handmatige controles en fouten bij het overzetten van data. Denk bijvoorbeeld aan het handmatig aanpassen van uitzonderingen in BTW-tarieven of het dubbel moeten invoeren van klantgegevens. Deze werkwijze kost veel tijd en brengt risico’s met zich mee.