RBI-Solutions blog

Van Economie naar Data Engineering: Een Interview met Jordi

Hoe word je een data engineer? Voor Jordi begon het allemaal tijdens een economiestudie en een beginnerscursus R. Wat volgde was een carrière vol leermomenten, technische uitdagingen en diverse werkvelden – van het CBS en een startup tot Defensie. In dit interview deelt hij zijn verhaal, ervaringen en waardevolle tips voor andere data professionals.

Hoe ben jij data engineer geworden?

“Het begon eigenlijk tijdens mijn economiestudie. Na een beginnerscursus R maakte ik er een sport van om waar mogelijk R of Python te gebruiken voor verschillende opdrachten, bijvoorbeeld voor het plotten van grafieken. Op die manier ben ik me steeds verder gaan verdiepen in Python en R. Dit bleek een gouden zet, want het leidde tot een stageplek bij het CBS. Ze zochten specifiek iemand met een economische achtergrond die ook kon programmeren.

Na mijn stage ben ik daar gebleven en in een data science traineetraject gerold. Ik hield me vooral bezig met het aanpassen en uitbreiden van productiesystemen, waarbij ik veel inhoudelijke controles en validaties uitvoerde. Het interessante was dat veel technisch werk werd gedaan door mensen zonder IT-achtergrond.”

Je hebt ook buiten het CBS gewerkt. Wat deed je toen?

“Ja, ik werkte een tijd bij een technische startup. Daar werkten we bijvoorbeeld aan het inzichtelijk maken van rijgedrag van vrachtwagenvloten. Ik kreeg te maken met streaming data, Kafka, CI/CD, DevOps, en microservices op een on-premise Kubernetes platform. Dit was een hele fascinerende tijd met werkzaamheden die uiteenliepen van het ontwerpen en bouwen van pipelines, het troubleshooten van productie-issues, onderzoeken van nieuwe bronnen tot het helpen zorgen dat IoT-devices correct werden geïnstalleerd in de voertuigen.”

Zie je jezelf meer als data scientist of data engineer?

“Zeker meer als data engineer. Ik ben altijd wel iets aan het leren, en mijn interesses wisselen regelmatig. Software engineering, web development, programmeertalen, containers, cloud, security, algoritmes, architectuur, testtechnieken, agile gedachtengoed, DevOps, etc. Juist voor data engineering komt dat van pas. Uiteindelijk gaat het me erom dat een oplossing waarde oplevert en dat collega’s er in de toekomst mee verder kunnen. Daarbij zou ik me niet willen beperken tot de wereld van ML/AI.”

Je bent uiteindelijk weer teruggegaan naar het CBS. Waarom?

“Eerlijk gezegd vooral vanwege zorgen om het voortbestaan van de startup. En ik had de kans om in een ontwikkelteam te werken waar we echt samen aan oplossingen bouwden. Het samenwerken en sparren had ik in eerdere teams bij het CBS gemist. In dit nieuwe team kon ik volop groeien, het voortouw nemen in verschillende projecten en uiteindelijk ook bijdragen aan teamoverstijgende uitdagingen.”

Je bent overgestapt naar RBI-Solutions, wat doe je nu?

“Ik heb verschillende prototypen gemaakt voor het laagdrempelig beheer van referentiedata, bijvoorbeeld door data stewards, in een cloud-oplossing op basis van object storage. De eerste prototypen maken gebruik van ADF en Snowflake.

Daarnaast heb ik een aantal trainingen voor collega’s verzorgd op het gebied van containers (Docker), orchestration (Kubernetes) en data management.

Voor RBI-Solutions ga je binnenkort naar Defensie?

“Heel binnenkort ga ik starten als data engineer bij Defensie, specifiek voor de Marechaussee, waar ik me bezig ga houden met streaming data en DevSecOps. Daar liggen hele mooie uitdagingen om hun bestaande omgevingen te migreren en een mooie bijdrage aan het nieuwe strategische data platform te leveren.”

Waarom heb je voor RBI gekozen?

“Vooral vanwege het team. Wat me direct opviel tijdens de sollicitatie was dat er meteen andere data engineers aanschoven bij het gesprek, niet alleen managers. De klik met de collega’s was er meteen – ze waren aardig, vriendelijk en gezellig. Ook waardeer ik de RBI-Friday voor studie en teambuilding. Daarnaast vind ik het fijn dat er niet één specifieke technologie of leverancier centraal staat. Na jaren bij het CBS wilde ik graag ervaring opdoen in verschillende contexten, en als consultant krijg je die kans.”

Heb je nog een tip voor andere data professionals?

“Absoluut: besteed meer aandacht aan testen! Ik zie vaak dat mensen denken ‘het is maar SQL, dat hoeven we niet te testen’ of ‘dat is ooit al getest’. Later blijkt dan dat je al lange tijd met foute data werkt. Testen is makkelijker en minder pijnlijk als je er al mee bezig bent aan het begin van je proces. Wacht er niet mee wacht tot er al een berg werk verzet is; een extra stap aan de voorkant bespaart je vaak drie stappen om het later te corrigeren.

En ja, dat past prima binnen een Agile werkwijze, je moet het alleen een goede plek geven: juist door er continu mee bezig te zijn kun je je systemen op zo’n manier vormgeven dat ze makkelijker (in losse delen) te testen zijn. Als het testen makkelijk is, geeft dat juist vertrouwen bij veranderingen.”

Lees verder over data en de diensten van RBI-Solutions in deze blog's:

MCP: De nieuwe AI standaard

MCP: De nieuwe AI standaard

Een begrip dat je online steeds vaker tegenkomt binnen al de buzz rond AI is ‘MCP’; weer zo’n afkorting die voor heel veel mensen cryptisch klinkt. Binnen de AI wereld is het echter wel een heel belangrijke vooruitgang: standaardisatie. Het verbinden van AI met bestaande APIs biedt heel veel mogelijkheden. Echter bouwt elke organisatie hun oplossing net weer anders. De ene bot praat zo tegen een API, de andere weer anders, en voor je het weet heb je een kerkhof aan connectors. Het idee is goed, de uitvoering vaak rommelig. Dit is precies waar MCP om de hoek komt kijken.

AI Agents: meer dan een slimmere chatbot

AI Agents: meer dan een slimmere chatbot

De meeste mensen zien AI nog steeds als een soort papegaai die tekstjes en plaatjes maakt zodra je iets vraagt. Handig, maar ook best oppervlakkig. Sinds enige tijd is er echter ook iets nieuws in opkomst: ‘Agentic AI’. AI-agenten dus die autonoom te werk kunnen gaan.

In plaats van pure generatie, kunnen ze een probleem ontleden, stappen zetten richting een oplossing, hun eigen werk checken en zelf andere tools gebruiken. We stappen dus richting zelfstandig werkende oplossingen. Je kunt het bijna zien als een leger van volledig virtuele assistenten en stagiaires. Dit belooft veel maar, brengt zeker ook gevaren.

AutoML: Machine Learning op de automatische piloot?

AutoML: Machine Learning op de automatische piloot?

Geautomatiseerd Machine Learning ook wel ‘AutoML’ is het automatiseren van de tijdrovende, iteratieve taken bij het ontwikkelen van machine learning-modellen. Je laat als het ware het bouwen van de modellen aan de machines zelf over.

Voor een paar tientjes een model dat kan voorspellen welke klanten over een paar maanden gaan vertrekken. Klinkt een beetje te goed om waar te zijn. Dan heb je natuurlijk ook geen Data Scientists meer nodig, toch? Nou, er zitten uiteraard wel wat haken en ogen aan. De specialisten op het gebied van Machine Learning verdwijnen ook zeker niet zo maar. Even een stap terug dus.

Data mesh: principes en praktische implementatie

Data mesh: principes en praktische implementatie

Elk relatief groot bedrijf bestaat uit verschillende afdelingen, elk met zijn eigen vraagstukken. Op datagebied is dat niet anders: marketing wil weten hoe campagnes performen, operations wil de huidige voorraad kunnen inzien, finance bewaakt de cashflow en productontwikkeling volgt klantgedrag.

Datamigratie afgerond… en nu?

Datamigratie afgerond… en nu?

Binnen veel organisaties is een datamigratie een enorme mijlpaal. Maandenlang werk je toe naar dat ene moment waarop alle data succesvol is overgezet naar de nieuwe operationele applicatie. Tijdens dat migratietraject worden allerlei controles ingericht: validatieregels, datakwaliteits­checks en integriteitscontroles die ervoor zorgen dat iedere klant, transactie of productrecord correct wordt overgezet. In de praktijk zien we alleen dat die regels direct na de migratie verdwijnen uit beeld. Terwijl ze juist ook dan van grote waarde zijn.

Meggie over haar werk bij de klant

Meggie over haar werk bij de klant

Meggie van den Boom, data engineer bij RBI Solutions, werkt al anderhalf jaar als data consultant bij een financiële dienstverlener. Ze geeft ons vandaag een kijkje in hoe haar werkzaamheden binnen haar team bij de klant eruit zien.

Metadata: je geheime wapen voor observability & governance

Metadata: je geheime wapen voor observability & governance

Metadata voor observability en governance: verder dan information_schema
Een aantal weken geleden, wijdden we een blog aan het gebruik van metadata voor het slimmer ontwikkelen en onderhouden van dataplatforms. Metadata wordt helaas nog vaak gezien als het saaie bijproduct van data: een paar kolomnamen, datatypes en misschien een timestamp, maar in moderne dataplatformen is dat nog maar het topje van de ijsberg. Metadata kan, mits goed benut, een krachtig fundament vormen voor zowel observability als governance. Het kan helpen bij het opsporen van problemen, het begrijpen van datastromen, het garanderen van compliance en zelfs het optimaliseren van prestaties.

Data migratie test en validatiestrategieën: hoe je zeker weet dat je data klopt na een migratie

Data migratie test en validatiestrategieën: hoe je zeker weet dat je data klopt na een migratie

Data migraties zijn voor veel organisaties een uitdaging: je stapt over van een oud systeem naar een nieuw, je moderniseert je datawarehouse of je integreert een nieuw platform na een fusie. Ondanks dat het technisch ‘slechts’ het verplaatsen van data lijkt, komt er meer bij kijken om een goede datamigratie uit te voeren. Hoe weet je zeker dat de data na migratie nog klopt? Dat er niets verloren is gegaan, of erger nog: dat je geen subtiele fouten hebt geïntroduceerd die maanden later pas boven water komen?
In deze blog staan we stil bij test- en validatiestrategieën bij data migraties. We bespreken waarom het testen van een datamigratie fundamenteel anders is dan het testen van een standaard applicatie, welke technieken je kunt gebruiken om betrouwbaarheid te garanderen, en hoe je omgaat met de praktische uitdagingen die je onderweg tegenkomt.

Waarom AI en automatisering niet werken zonder goede data engineering

Waarom AI en automatisering niet werken zonder goede data engineering

AI is hot. Iedereen wil er iets mee. Van slimme voorspellingen tot volledige automatisering van bedrijfsprocessen; organisaties investeren massaal in artificial intelligence. Maar wie verder kijkt dan de hype, ziet dat veel AI-projecten stranden nog voordat ze echt waarde opleveren. Niet vanwege de modellen of de tooling, maar vanwege iets veel fundamentelers: de onderliggende data en hoe je ermee omgaat. Of specifieker: de data engineering erachter. Want zonder robuuste data-infrastructuur is AI net zo betrouwbaar als een kompas in een magneetveld. 

Data-APK: inzicht en zekerheid voor jouw bedrijfsdata

Data-APK: inzicht en zekerheid voor jouw bedrijfsdata

In een tijd waarin beslissingen steeds meer op data leunen, is het essentieel om zeker te weten dat die data klopt. Net als een auto die regelmatig een APK nodig heeft om veilig te blijven rijden, vraagt ook jouw bedrijfsdata om een periodieke check. Bij RBI Solutions noemen we dat de Data-APK: een slimme, laagdrempelige manier om jouw data in kaart te brengen, problemen te signaleren en waardevolle inzichten te bieden die jouw organisatie helpen sneller en beter beslissingen te nemen.

de transitie met Microsoft Fabric

de transitie met Microsoft Fabric

In veel MKB-organisaties is het verzamelen en rapporteren van data nog steeds een tijdrovende en foutgevoelige klus. Excel-bestanden circuleren overal, gegevens worden handmatig gecorrigeerd in verschillende systemen en rapportages worden met de hand bijgewerkt. Het gevolg is dat managers en analisten vaak worstelen met verouderde inzichten, inconsistente cijfers en een gebrek aan overzicht. Hierdoor duurt het langer voordat er goede beslissingen genomen kunnen worden en het vertrouwen in de data neemt af.

Een bekend probleem is dat data uit verschillende systemen, zoals een boekhoudpakket, CRM of HR-software, niet automatisch met elkaar verbonden zijn. Dit leidt tot dubbel werk, handmatige controles en fouten bij het overzetten van data. Denk bijvoorbeeld aan het handmatig aanpassen van uitzonderingen in BTW-tarieven of het dubbel moeten invoeren van klantgegevens. Deze werkwijze kost veel tijd en brengt risico’s met zich mee.

Metagegevens als motor: hoe gebruik van information_schema je dataplatform slimmer kan maken

Metagegevens als motor: hoe gebruik van information_schema je dataplatform slimmer kan maken

Hopelijk weet iedereen die met databases werkt van het bestaan van standaard metagegevens waarmee er gemakkelijk inzicht verkregen kan worden over de structuur, data en opzet van de database. Ook voor dataplatforms zijn deze objecten enorm waardevol. Toch wordt het potentieel van metagegevens nog vaak onderschat, terwijl vrijwel elke (moderne) relationele database, van PostgreSQL tot Snowflake, een krachtig en vaak onderbenut startpunt biedt in de vorm van information_schema.

In deze blog duiken we dieper in hoe metagegevens via information_schema je dataplatform slimmer, transparanter en beheersbaarder maken. Voor zowel data engineers die pipelines bouwen, als analisten die vertrouwen op stabiele datasets, bieden deze metagegevens enorme voordelen. Van automatisch documenteren tot het voorkomen van incidenten: wie information_schema goed gebruikt, bouwt een robuuster platform.