Power BI

VertiPaq-compressie: twee identieke kolommen met grote verschillen

Reddit r/PowerBI

Samenvatting

Power BI krijgt nieuwe inzichten in VertiPaq-compressie die data-efficiëntie verbetert.

VertiPaq-compressie: wat er gebeurt

Recent onderzoek heeft aangetoond dat in Power BI's VertiPaq-opslagengine twee identieke kolommen met bijna dezelfde cardinaliteit toch sterk van elkaar kunnen verschillen in datagrootte. In een praktijkexperiment met 3,4 miljoen rijen en 234 kolommen bleek dat kolom A met een cardinaliteit van 5.701 6,77 MB in beslag nam, terwijl kolom B met een cardinaliteit van 5.033 slechts 0,02 MB vereiste, ondanks dat beide kolommen dezelfde datatypes en encodering hadden.

Waarom dit belangrijk is

Deze bevinding is cruciaal voor BI-professionals die werken met Power BI, omdat het aantoont hoe dataopslag kan variëren bij schijnbaar gelijke gegevens. Dit legt de nadruk op het belang van data-analyse en -optimalisatie, vooral in een tijd waarin organisatie steeds grotere datasets moet beheren. Concurrenten zoals Tableau en Qlik kijken ook naar manieren om opslag en prestaties te verbeteren, maar deze inzichten in de internals van VertiPaq bieden unieke kansen voor efficiëntie, vooral voor grote datamodelontwikkelaars.

Concrete takeaway

BI-professionals moeten letten op de efficiëntie van dataopslag bij het ontwerpen van datamodellen in Power BI. Het is essentieel om onderscheid te maken in de structuur en methode van dataopslag om de prestaties en kosten te optimaliseren.

Lees het volledige artikel
Meer over Power BI →