Data assessment

Data ligt altijd ten grondslag aan al het werk dat IMPRES verricht. Wat het des te belangrijker maakt dat deze data correct en volledig is. Dit is waar wij ons mee bezighouden binnen een data assessment traject. We kijken naar de kwaliteit van data, waar deze verbeterd kan worden, waar deze aangevuld moet worden en hoe we een zo schoon mogelijke output source kunnen genereren. Benieuwd hoe we hier in te werk gaan en hoe we jou hiermee verder helpen? Lees snel verder! 

Benieuwd naar de mogelijkheden voor jouw bedrijf?

Neem hier contact op

Data assessment is essentieel voor data quality

Bij het opzetten van bijvoorbeeld een data warehouse, loop je tegen een grote hoeveelheid verschillende datastromen aan. Denk dan bijvoorbeeld aan verschillende voorraadsystemen. Deze systemen hebben vaak eigen, interne benamingen voor dingen als producteigenschappen. Of het nu verkeerde basisinstellingen of menselijke fouten zijn, dit soort verschillen zijn bijna onvermijdelijk als je zonder een merge in gedachten start met het inrichten van je systemen. Op het moment dat deze bronnen gecombineerd worden, veroorzaakt dit samenvoegingsconflicten. Deze conflicten zorgen vervolgens dat de master-bron vervuild en onbruikbaar raakt.

“We all say we like data, but it’s not the data but the insights that we derive from it that is what we care about. It all starts with qualitative data.”
Q. Ethan McCallum

Opschonen en corrigeren

Veel databronnen zijn voordat ze gecombineerd worden met andere bronnen al vervuild. Denk dan aan dubbel ingevoerde producten of items zonder barcodes. Het ontbreken van deze informatie levert vervolgens problemen op bij bijvoorbeeld het handmatig her-inventariseren van producten. Als een barcode dan geen resultaat oplevert bij het inscannen, resulteert dit enerzijds in een product zonder actuele voorraad in het voorraadsysteem en een product zonder plaats en data in het magazijn.

Zo ontstaan er onderaan de streep door simpele slordigheden dubbele producten, omdat het niet-teruggevonden product in deze situatie vaak opnieuw ingevoerd wordt en de oude niet meer voorzien wordt van updates.

In sommige gevallen, zoals in het bovenstaande voorbeeld, is een foutje in de data niet van levensbelang. Als je het echter over dingen als medische of financiële data hebt, wordt dit een moeilijke situatie. Denk bijvoorbeeld aan risico ratings die in het ene systeem gegeven worden op een schaal van 1 tot 10 en in het andere systeem op een schaal van 1 tot 20, maar wel hetzelfde label hebben gekregen.

Op het moment dat deze data gecombineerd wordt, ontstaat er een wezenlijk probleem. Met een data quality assessment vangen we dit soort problemen af, nog voordat ze ontstaan. 

Ontdek wat IMPRES in huis heeft

Joris vertelt je graag wat IMPRES voor jouw bedrijf kan betekenen en geeft je hier uitgebreid informatie over!