Da li je podatak tačan? Je li ažuran? Kompletan? Da li smo ga dobili na vreme? Nije dovoljno da sebi postavimo samo prvo pitanje kako bi podatke proglasili kvalitetnim. Kada odgovorimo na ovu, inače nepotpunu listu pitanja, zapravo analiziramo podatak sa različitih aspekata. Ili bolje rečeno, sagledavamo različite dimenzije kvaliteta podatka. U ovom članku ćemo objasniti ključne dimenzije kvaliteta podataka:
Tačnost podataka predstavlja meru u kojoj ti podaci odslikavaju entitete ili događaje iz stvarnog sveta. Primeri:
- stanje računa depozita klijenta banke je pravo, realno stanje
- adresa post-paid pretplatnika mobilnog operatera je postojeća i tačna
Treba naglasiti da bi u oba navedena slučaja netačna informacija imala negativan uticaj na poslovanje. Netačno stanje na računu u banci bi imalo katastrofalne posledice, isto kao i nemogućnost dostavljanja mesečnog računa pretplatniku mobilnog operatera. Da je reč o prodavnici bele tehnike, netačne adrese kupaca u bazi podataka ne bi imale velike negativne posledice obzirom da nijedan njen ključni proces se ne oslanja na ove podatke.
Kompletnost podataka govori koliko su podaci kompletni za određen entitet ili događaj koji predstavljaju iz stvarnog sveta i to u onoj meri u kojoj to korisnici očekuju. Svaki podatak u bazi se može svrstati u jednu od dve grupe: obavezni ili neobavezni podaci. Pošto se sistem pravi na osnovu zahteva korisnika, odatle proističe da su za korisnika kompletni oni podaci koji sadrže sve obavezne elemente. Primer:
- transakcija na računu klijenta banke sadrži sve potrebne informacije: račun sa kog su preneta sredstva, račun na koji su preneta sredstva, iznos, valuta, datum, ...
- pretplatnik mobilnog operatera ima potpune kontakt podatke u bazi
Čak i ako su su podaci kompletni oni ne moraju biti i tačni. Na primer, transakcija može imati nepostojeću valutu ili datum u budućnosti.
Konzistentnost podataka odgovara na pitanje da li različita pojavljivanja istog entiteta daju različite informacije ili da li su atributi entiteta međusobno konfliktni. Primeri:
- klijent je otplatio kredit ali status kredita je “u otplati”
- pretplatnik mobilnog operatera je prešao sa jednog paketa na drugi, ali su oba u statusu “aktivan”
Iako na prvi pogled ovakva stanja deluju kao posledica nesavršenih programa, često nastaju i kao posledica greške korisnika, postojanja redundantnih podataka, migracija na nov sistem ili integracije podataka.
Konformnost podataka je stepen u kom oni odgovaraju određenom formatu. Većina podataka ima format i za svaki entitet bi taj podatak trebao da bude u istom formatu. Primeri:
- datum potpisivanja ugovora uvek mora biti u istom istom formatu
- broj telefon treba da bude zapisan uvek u istom formatu
- adresa uvek treba da bude uneta u istom formatu
Sasvim je logično da do ovakvih problema može doći iz više razloga: korisniku je dopušteno da unese podatak u proizvoljnom formatu, različiti sistemi koriste različite formate, datume unose korisnici sa različitih geografskih lokacija pa koriste različite formate datuma, prilikom migracije nije dobro izvršena konverzija, ... Ova vrsta problema kvaliteta podataka je posebno izražena prilikom izveštavanja: grupisanja, filtriranja i pretrage podataka.
Pravovremenost podataka govori da li su podaci dostupni korisniku onda kada su mu potrebni. Kao i kompletnost podataka, i ovo je kategorija kod koje je naročito izražena uloga korisnika u njenom definisanju. To znači da korisnici određuju kada su im podaci potrebni. Primeri:
- zaduženja preko kreditnih i debitnih kartica se moraju odmah odraziti na stanje na računu; ukoliko bi postojalo zakašnjenje, klijent bi mogao da podigne više novca nego što sme da potroši
- minuti koje iskoristi pre-paid korisnik mobilnog operatera moraju odmah biti evidentirani, kako korisnik ne bi mogao da potroši više minuta nego što je dozvoljeno; logično je da kod post-paid korisnika vreme ažuriranja utrošenih minuta nije kritično
- naročito je bitno ispoštovati rokove za predaju zvaničnih izveštaja; da bi se izveštaji napravili na vreme, u vreme njihovog pravljenja svi podaci moraju da budu dostupni bez zakašnjenja
- donosioci odluke moraju da znaju sa kojim podacima raspolažu; ako podaci u sistem za izveštavanje dospevaju 15-og u mesecu, oni moraju znati da su im do sredine meseca podaci nekompletni za tekući mesec; sa druge strane, ovaj tempo pristizanja podataka je odgovarajući za istorijske analize
Uzrok nepravovremenog pristizanja podataka može biti u neažurnosti ljudi, tj. kasnog unosa podataka ili u tehničkom rešenju, na primer sporoj integraciji podataka iz različitih sistema.
Predstavili smo ključne dimenzije kvaliteta podataka. Treba imati na umu da treba posmatrati samo one dimenzije koje su nam od interesa. To znači da ne treba analizirati dimenzije podataka koji nam nisu ključni za poslovne procese. Ali treba podatke analizirati po više dimenzija, jer ćemo u suprotnom imati lažnu predstavu o njihovom kvalitetu.
No comments:
Post a Comment