AI & Analytics

Ich habe MessyData als Open Source veröffentlicht – einen Generator für synthetische fehlerhafte Daten. Er erzeugt programmatisch Daten mit Anomalien und Qualitätsproblemen.

Reddit r/datascience

Samenvatting

MessyData ist ein neu veröffentlichtes Open-Source-Python-Tool, mit dem Benutzer synthetische Daten mit Anomalien und Qualitätsproblemen generieren können. Es ermöglicht die Simulation realistischer Datenszenarien, einschließlich fehlender Werte und doppelter Datensätze. Dies macht es zu einer wertvollen Ressource für BI-Profis, die Datenflüsse testen und demonstrieren möchten.

Lees het volledige artikel