RBI-Solutions blog

Data mesh: principes en praktische implementatie

Elk relatief groot bedrijf bestaat uit verschillende afdelingen, elk met zijn eigen vraagstukken. Op datagebied is dat niet anders: marketing wil weten hoe campagnes performen, operations wil de huidige voorraad kunnen inzien, finance bewaakt de cashflow en productontwikkeling volgt klantgedrag.

In theorie zou iedere afdeling waardevolle puzzelstukjes moeten leveren aan het centrale dataplatform, waar alle inzichten bij elkaar komen, terwijl in werkelijkheid alles voelt alsof het maar losjes naast elkaar ligt. Het data-platform schiet tekort, het centrale team is continu overbelast, en de business moppert dat alles te traag gaat. In zo’n setting kan het data mesh principe een uitkomst bieden!

Wat is data mesh eigenlijk?
Data mesh draait om het concept dat ieder domein ervoor zorgt dat hun eigen data als product aangeboden kan worden. In plaats van één centraal datateam dat alle domeinen bedient, van verzamelen tot ontsluiten en beheren, doet ieder domein dat zelf. Marketing, operations en finance zijn niet langer alleen producenten van data, maar ook de eigenaren ervan. Ze verzorgen alles: van kwaliteit, documentatie, vindbaarheid tot veiligheid. Het centrale team is niet meer de eigenaar van alle datalogistieke processen, maar faciliteert: met standaarden, tooling en best practices. Zo wordt de centrale bottleneck weggehaald.

Data mesh is geen buzzword, maar een serieuze shift: het gaat om domeingericht eigenaarschap, data als product, selfservice infrastructuur én federated governance. Het klinkt misschien theoretisch, maar in de praktijk blijkt het de sleutel om data écht bruikbaar, betrouwbaar en waardevol te maken.

Hoe ziet dat eruit in de praktijk?
Stel je voor: marketing publiceert een dataset met campagneresultaten, operations maakt een realtime voorraaddataset beschikbaar en finance deelt transactionele data. Elk domein zorgt dat die dataset helder is: je kunt hem vinden, vertrouwen en via duidelijke documentatie gebruiken. Dat vergt een data self-service platform, want uiteraard wil niemand dat ieder domein zelf zware pipelinecode moet schrijven of infrastructuur moet beheren.

In zo’n platform zien we vaak tooling als dbt/Airflow of Databricks voor het bouwen van pipelines. Voor het catalogiseren en inzichtelijk maken van data gebruiken teams tools als Collibra of DataHub. Het centrale team regelt zaken als toegang, monitoring en kwaliteitsregels, maar geeft teams wel de vrijheid om hun eigen products te maken.

Wat zijn de valkuilen?
De eerste misvatting is dat data mesh vooral een technische verandering is, terwijl het in de kern veel meer cultureel en organisatorisch is. Domeinteams moeten echt in staat gesteld worden om data als product te leveren, met alle verantwoordelijkheden die daarbij horen. Dat vraagt motivatie, vaardigheden en duidelijke incentives.

Een andere uitdaging is governance. Hoe zorg je dat marketing, finance en operations niet ieder hun eigen klant-definitie hanteren? Of dat omzet in drie verschillende varianten bestaat? Data mesh werkt met federated governance: zodat standaarden en naming conventions centraal zijn, maar domeinen ruimte hebben voor eigen keuzes. Tools voor lineage, catalogusbeheer en kwaliteits monitoring worden dan cruciaal.

Daarnaast moet je infrastructuur schaalbaar zijn. Domeinteams moeten pipelines kunnen draaien, snel en zelfstandig. Tegelijkertijd wil je geen wildgroei aan tools. Daarom zien we vaak een centrale cloudomgeving, bijvoorbeeld Snowflake, Databricks of BigQuery, met standaardbouwstenen, waarin domeinen hun eigen ‘ruimte’ krijgen.

Waar zie je dit vandaag de dag?
Data mesh past uitstekend in de trend van cloud-native platforms en het (eindelijk) afscheid nemen van de moeizame data lakes. Organisaties willen metadata-management, data observability en geautomatiseerde governance. Precies wat je nodig hebt in een mesh-aanpak.

AI en ML worden beter als je domeinrijke data van hoge kwaliteit hebt. En leveranciers springen daarop in: veel tooling (van Azure tot open source) krijgt nu functies voor lineage, data contracten, en mesh-vriendelijke architectuur.

Wat levert het op?
Als je data mesh goed uitrolt, verandert er echt iets. Domeinen leveren betrouwbare dataproducten, andere teams kunnen sneller innoveren, en het centrale team ligt niet langer vast door bureaucratische requests. Het wordt schaalbaar, wendbaar en menselijker.

Toekomstvisie? De komende jaren zal blijken welke organisaties data mesh echt laten werken. Halfslachtige pilots horen misschien tot de praktijk. Maar voor wie het goed doet, voelt die puzzel straks wél als waardevolle bouwstenen. Niet moeizaam, maar modulair en krachtig.

Lees verder over data en de diensten van RBI-Solutions in deze blog's:

Datamigratie afgerond… en nu?

Datamigratie afgerond… en nu?

Binnen veel organisaties is een datamigratie een enorme mijlpaal. Maandenlang werk je toe naar dat ene moment waarop alle data succesvol is overgezet naar de nieuwe operationele applicatie. Tijdens dat migratietraject worden allerlei controles ingericht: validatieregels, datakwaliteits­checks en integriteitscontroles die ervoor zorgen dat iedere klant, transactie of productrecord correct wordt overgezet. In de praktijk zien we alleen dat die regels direct na de migratie verdwijnen uit beeld. Terwijl ze juist ook dan van grote waarde zijn.

Meggie over haar werk bij de klant

Meggie over haar werk bij de klant

Meggie van den Boom, data engineer bij RBI Solutions, werkt al anderhalf jaar als data consultant bij een financiële dienstverlener. Ze geeft ons vandaag een kijkje in hoe haar werkzaamheden binnen haar team bij de klant eruit zien.

Metadata: je geheime wapen voor observability & governance

Metadata: je geheime wapen voor observability & governance

Metadata voor observability en governance: verder dan information_schema
Een aantal weken geleden, wijdden we een blog aan het gebruik van metadata voor het slimmer ontwikkelen en onderhouden van dataplatforms. Metadata wordt helaas nog vaak gezien als het saaie bijproduct van data: een paar kolomnamen, datatypes en misschien een timestamp, maar in moderne dataplatformen is dat nog maar het topje van de ijsberg. Metadata kan, mits goed benut, een krachtig fundament vormen voor zowel observability als governance. Het kan helpen bij het opsporen van problemen, het begrijpen van datastromen, het garanderen van compliance en zelfs het optimaliseren van prestaties.

Data migratie test en validatiestrategieën: hoe je zeker weet dat je data klopt na een migratie

Data migratie test en validatiestrategieën: hoe je zeker weet dat je data klopt na een migratie

Data migraties zijn voor veel organisaties een uitdaging: je stapt over van een oud systeem naar een nieuw, je moderniseert je datawarehouse of je integreert een nieuw platform na een fusie. Ondanks dat het technisch ‘slechts’ het verplaatsen van data lijkt, komt er meer bij kijken om een goede datamigratie uit te voeren. Hoe weet je zeker dat de data na migratie nog klopt? Dat er niets verloren is gegaan, of erger nog: dat je geen subtiele fouten hebt geïntroduceerd die maanden later pas boven water komen?
In deze blog staan we stil bij test- en validatiestrategieën bij data migraties. We bespreken waarom het testen van een datamigratie fundamenteel anders is dan het testen van een standaard applicatie, welke technieken je kunt gebruiken om betrouwbaarheid te garanderen, en hoe je omgaat met de praktische uitdagingen die je onderweg tegenkomt.

Waarom AI en automatisering niet werken zonder goede data engineering

Waarom AI en automatisering niet werken zonder goede data engineering

AI is hot. Iedereen wil er iets mee. Van slimme voorspellingen tot volledige automatisering van bedrijfsprocessen; organisaties investeren massaal in artificial intelligence. Maar wie verder kijkt dan de hype, ziet dat veel AI-projecten stranden nog voordat ze echt waarde opleveren. Niet vanwege de modellen of de tooling, maar vanwege iets veel fundamentelers: de onderliggende data en hoe je ermee omgaat. Of specifieker: de data engineering erachter. Want zonder robuuste data-infrastructuur is AI net zo betrouwbaar als een kompas in een magneetveld. 

Data-APK: inzicht en zekerheid voor jouw bedrijfsdata

Data-APK: inzicht en zekerheid voor jouw bedrijfsdata

In een tijd waarin beslissingen steeds meer op data leunen, is het essentieel om zeker te weten dat die data klopt. Net als een auto die regelmatig een APK nodig heeft om veilig te blijven rijden, vraagt ook jouw bedrijfsdata om een periodieke check. Bij RBI Solutions noemen we dat de Data-APK: een slimme, laagdrempelige manier om jouw data in kaart te brengen, problemen te signaleren en waardevolle inzichten te bieden die jouw organisatie helpen sneller en beter beslissingen te nemen.

de transitie met Microsoft Fabric

de transitie met Microsoft Fabric

In veel MKB-organisaties is het verzamelen en rapporteren van data nog steeds een tijdrovende en foutgevoelige klus. Excel-bestanden circuleren overal, gegevens worden handmatig gecorrigeerd in verschillende systemen en rapportages worden met de hand bijgewerkt. Het gevolg is dat managers en analisten vaak worstelen met verouderde inzichten, inconsistente cijfers en een gebrek aan overzicht. Hierdoor duurt het langer voordat er goede beslissingen genomen kunnen worden en het vertrouwen in de data neemt af.

Een bekend probleem is dat data uit verschillende systemen, zoals een boekhoudpakket, CRM of HR-software, niet automatisch met elkaar verbonden zijn. Dit leidt tot dubbel werk, handmatige controles en fouten bij het overzetten van data. Denk bijvoorbeeld aan het handmatig aanpassen van uitzonderingen in BTW-tarieven of het dubbel moeten invoeren van klantgegevens. Deze werkwijze kost veel tijd en brengt risico’s met zich mee.

Metagegevens als motor: hoe gebruik van information_schema je dataplatform slimmer kan maken

Metagegevens als motor: hoe gebruik van information_schema je dataplatform slimmer kan maken

Hopelijk weet iedereen die met databases werkt van het bestaan van standaard metagegevens waarmee er gemakkelijk inzicht verkregen kan worden over de structuur, data en opzet van de database. Ook voor dataplatforms zijn deze objecten enorm waardevol. Toch wordt het potentieel van metagegevens nog vaak onderschat, terwijl vrijwel elke (moderne) relationele database, van PostgreSQL tot Snowflake, een krachtig en vaak onderbenut startpunt biedt in de vorm van information_schema.

In deze blog duiken we dieper in hoe metagegevens via information_schema je dataplatform slimmer, transparanter en beheersbaarder maken. Voor zowel data engineers die pipelines bouwen, als analisten die vertrouwen op stabiele datasets, bieden deze metagegevens enorme voordelen. Van automatisch documenteren tot het voorkomen van incidenten: wie information_schema goed gebruikt, bouwt een robuuster platform.

Van tijd naar trigger: De weg naar een event-driven data architectuur

Van tijd naar trigger: De weg naar een event-driven data architectuur

Sinds het begin van het gebruik van Business Intelligence hebben organisaties vertrouwd op periodieke dataverwerking, de zogenaamde ’batch jobs’ die elke nacht draaien. Sindsdien is de behoefte aan snelheid, flexibiliteit en realtime inzichten enorm toegenomen. Die behoefte zorgt dan ook voor een fundamentele verschuiving in hoe we data-architecturen ontwerpen: weg van batch processen, op weg naar een event-driven benadering.

Maar wat betekent dat eigenlijk: ’event-driven’? En waarom zou je hier als data engineer, analist, data scientist of business gebruiker wakker van moeten liggen? In deze blog duiken we in de wereld van event-driven data-architecturen, hun voordelen, uitdagingen, en de tools die deze transitie mogelijk maken.

DataOps, DevOps en MLOps: Oude wijn in nieuwe zakken of écht anders?

DataOps, DevOps en MLOps: Oude wijn in nieuwe zakken of écht anders?

In een data gedreven organisatie vliegen de samenwerkingstermen je om de oren: DevOps, DataOps, MLOps. Deze drie termen, die inderdaad erg hetzelfde klinken (en door sommige organisaties ingevuld worden door een beheerder in een ontwikkelteam te zetten), verschillen in de praktijk aanzienlijk in toepassing, focus en doel. Voor wie dagelijks werkt met data of systemen die op data drijven, is het essentieel om deze termen niet alleen te kennen, maar ook te begrijpen wat ze betekenen en hoe ze zich tot elkaar verhouden. Daar nemen we jullie in deze blog dan ook in mee.

INTERVIEW MET DATA ENGINEER/BI CONSULTANT Said Saoud

INTERVIEW MET DATA ENGINEER/BI CONSULTANT Said Saoud

Wat begon met een goed gesprek en een flinke dosis enthousiasme, groeide uit tot een veelzijdige carrière in data engineering bij RBI. In dit interview deelt Said Saoud zijn reis bij RBI: hoe hij begon, waar hij aan werkt en waarom hij zich thuis voelt in de wereld van data engineering en BI. Benieuwd naar zijn ervaringen, tools en visie op de toekomst van data? Lees het hele verhaal in deze blogpost.

Data Science: Een eenmalig model of integratie in de dagelijkse operatie?

Data Science: Een eenmalig model of integratie in de dagelijkse operatie?

In veel organisaties is data science inmiddels geen onbekende meer. Data scientists bouwen geavanceerde voorspellende modellen, werken met machine learning en experimenteren met AI om waarde te halen uit grote hoeveelheden data. Er zit echter vaak een kloof tussen het bouwen van een model en het daadwerkelijk creëren van impact in de dagelijkse operatie.