Alle berichten van Armando Dörsek

Datakwaliteit: invloeden, meten en maatregelen

Klanten rekenen op de betrouwbaarheid van de informatie waarmee ze werken. De teams die zich bezig houden met data warehousing, business Intelligence en analytics zijn gebaat bij juiste, volledige en accurate gegevens. Als we die termen noemen, raken we het aspect datakwaliteit.

Datakwaliteit is de “fitness for use” van de gegevens.

Elk bedrijfsproces kan zijn eigen eisen stellen aan de data.
De systemen die de primaire bedrijfsprocessen ondersteunen (bv. logistiek, verkoop, planning, polisadministratie) zullen zich richten op een goede kwaliteit van gegevens voor hún specifieke bedrijfsproces of -keten. Niet meer en niet minder. Zodra we deze gegevens willen gebruiken in een bredere context, voor business intelligence en analyticsdoeleinden, kunnen we ertegenaan lopen dat deze gegevens niet zonder meer bruikbaar blijken: de datakwaliteit kan te laag zijn.

Oorzaken voor slechte datakwaliteit
Datakwaliteit kan onder meer te wensen overlaten door (1) slechte invoer bij de bron.  Medewerkers in een callcenter worden soms afgerekend op het aantal verwerkte gesprekken, niet op de kwaliteit van de ingevoerde data. Om tijdswinst te boeken kunnen zij o.a. besluiten om het niet zo nauw te nemen met de spelling bij het opvoeren van klantgegevens en om niet-verplichte velden over te slaan. Dit heeft direct weerslag op de datakwaliteit.

Datakwaliteit zal afnemen door het (2) verstrijken van de tijd. Adressen van klanten zullen als gevolg van verhuizingen enz. veranderen. Regelmatige controle op de actualiteit van dergelijke gegevens helpt bij het behouden van juistheid van deze gegevens. Ook veranderende afspraken over de notatie van o.a. kentekens, telefoonnummers en landenaanduidingen hebben hun weerslag op de datakwaliteit.

Gegevens kunnen inboeten aan kwaliteit als gevolg van (3) internationalisatie: bij het combineren van data uit binnen- en buitenland kunnen bv. issues optreden ten aanzien van gebruikte character sets of door het introduceren van andere valuta, adresnotaties, etc.

Bij (4) conversies en migraties van gegevens, bv. als gevolg van vervanging of integratie van geautomatiseerde systemen, overnames (integreren van datasets van verschillende bedrijven) of schoning (verouderde producten, verstreken bewaartermijnen) kunnen mankementen ontstaan aan de gegevens.

Voorkomen en repareren
Op voorgaande oorzaken kan een datawarehouse- en business intelligence team slechts indirect invloed uitoefenen. Waar het team wél direct invloed op heeft, is op de (5) kwaliteit van de verwerking: het extractie-, transformatie- en laadproces van de data en de  (6) juiste weergave van de data in de informatieproducten. Dit kan door goed testen en toetsen onder controle worden gebracht.

Onder de noemer (7) data cleaning of data cleansing worden activiteiten geschaard die de gegevens moet corrigeren en aanvullen. Deze activiteit is niet voorbehouden aan datawarehouse- en business intelligence teams, maar kan ook direct op de primaire systemen zelf plaats vinden.

Gegevensarchitecten moeten besluiten nemen over wáár de gegevens gerepareerd worden: in de bron of bv. in het datawarehouse. Als voor de laatste optie wordt gekozen dan is één ding zeker: dit vergt een forse inspanning in termen van ontwikkeling en testen.

Objectief meetbare datakwaliteit
Kwaliteit kunnen we meetbaar maken aan de hand van kwaliteitsattributen of -dimensies. Zo kennen we voor het in kaart brengen van de kwaliteit van software en ICT systemen de norm ISO25010 en de kwaliteitsatributen van TMap Next.

De datakwaliteit kun je uitdrukken met met behulp van specifieke kwaliteitsattributen of dimensies, zoals die van ISO 25012, het IDQ model van Valori (Bouman) of die van de Data Management Association (DAMA).

Take Aways van de Dag

  • Start met het meten van data kwaliteit en stel jezelf als organisatie doelen
  • Stem het testproces hierop af en bepaal de te behalen dekking
  • Integreer data profiling vanaf de start in het analyse-, ontwerp- en testproces. Voeg data profiling structureel toe aan het beheerproces om niet verrast te worden door wijzigingen (in data) in bronsystemen.
  • Besef dat de datakwaliteit niet statisch is maar zich zal ontwikkelen. Zorg dat het systeem niet alleen kan omgaan met de data van gisteren – maar óók van morgen!

Vragen?
Als u vragen heeft over het bovenstaande, bv. u wilt een start maken met het objectief meetbaar maken van de datakwaliteit in uw organisatie, neem vooral contact op met Verified. We staan u graag te woord.

Presentatie TestNet Thema-avond Werkgroep “Testen van BI/DWH”

Op 8 september 2015 stonden Ferran Rohaan (CloseSure), Brian Engel (Squerist) en Armando Dörsek (Verified) op de bühne bij de thema-avond van TestNet over het testen van Business Intelligence en Datawarehousing. Het NBC was gevuld met bijna 100 testers, waarvan ongeveer de helft nu actief is in een BI/DWH-traject.

Alle drie de sprekers maken deel uit van de werkgroep Testen van BI/DWH van TestNet en namen een stuk van de presentatie voor hun rekening.

Ferran Rohaan vertelde over enkele uitgangspunten van Business Intelligence en Datawarehousing. Hij sprak ook over de mogelijkheden die het realiseren van een Audit Trail biedt voor ontwikkelaars, testers, beheerders en auditors.

Brian Engel sprak over nut & noodzaak van testautomatisering in BI/DWH projecten en het aanbod en de selectie van testtools gericht op deze trajecten.

Armando vertelde over de werkgroep en de producten daarvan. Hij lichtte de teststrategie in BI/DWH-trajecten toe, hoe dit zich vertaalt naar een testaanpak, of bekende testspecificatietechnieken inzetbaar zijn  en welke  rollen en “skills” passen bij BI/DWH-testers.

Veel bezoekers  maakten bij de borrel gebruik van de mogelijkheid om met de presentatoren spreken over persoonlijke uitdagingen in BI-trajecten. Zo kwamen o.a. ontwikkelingen zoals Big Data, Agile/Scrum en testen aan de orde. Vervolgafspraken staan reeds genoteerd! Heeft u ook een vraag, neem dan vrijblijvend contact op met de sprekers: thema-avond-BI@verified.nl

De presentatie: Testnet-Werkgroep-BI-Testen-20150908-v1.0

 

De video:

Presentation at Nordic Testing Days 2013

The Nordic Testing Days 2013 were held in Tallinn, Estonia from 5-7 June. Together with colleague and friend Iris Groenewoudt I was invited to give a presentation on Testing in Agile Business Intelligence projects.

The presentation can be found here on the NTD website.

We had a great time in the beautiful city of Tallinn and we met many nice new colleagues in the field of Software Testing. I certainly hope to visit Tallinn again in the future.

ntd2013_presentatie (2)

 

 

 

Estonia here I come!

I am very happy to announce that I will be presenting at Nordic Testing Days 2013!

Earlier this year I responded to the Call For Papers and my presentation about “Testing in Agile Business Intelligence Projects” was selected.

The Nordic Testing Days will be held in Tallinn, Estonia from 5-7 June at the beautiful Meriton.  The program consists of one tutorial day and two conference days. You can attend one or both, or even share days with a colleague. This year’s theme is “Testers & Developers – Partners in Quality”.

Other names are: Alon Linetzki (Agile Testing), Geoff Thompson (TMMi) and Margus Simson (key note speaker).

Hope to see you at #NTD2013!

Nu als download: presentatie TestNet Event (2012)

Dank u wel voor uw interesse in de presentatie van Iris Groenewoudt en Armando Dörsek op het TestNet najaarsevenement (2012).

Artikel
Het artikel dat we in aanloop naar het Evenement hebben geschreven is nu te downloaden via de TestNet website.

Presentatie
De presentatie zoals ik die op het TestNet Najaarsevenement heb verzorgd staat hier op deze site en ook op die van TestNet.

NB: Binnenkort zullen we de uitgebreide versie van dit artikel net als verdere referenties, verwijzingen en andere downloads over dit onderwerp plaatsen.

Contact
Wilt u contact met me opnemen, schroom dan niet om het contactformulier in te vullen of mij te bellen, zie de Contactpagina.