Samenvatting
Spark lineage is een belangrijk maar vaak over het hoofd gezien aspect binnen data engineering. Dit artikel beschrijft de ontwikkeling van een oplossing voor het bouwen van Spark lineage in data lakes, waarmee professionals beter inzicht krijgen in datastromen en gegevensafhankelijkheden.
Verdiep je kennis
Kennisbank
ETL uitgelegd — Extract, Transform, Load in gewone taal
Wat is ETL? Leer hoe Extract, Transform en Load werkt, het verschil met ELT, en welke tools je kunt gebruiken. Helder ui...
KennisbankData governance in het MKB — Praktische aanpak
Wat is data governance en hoe pak je het aan als MKB-organisatie? Een praktisch stappenplan met aandacht voor AVG-compli...
KennisbankData lakehouse uitgelegd — Het beste van twee werelden
Wat is een data lakehouse en waarom combineert het het beste van data warehouses en data lakes? Vergelijking, architectu...