Da li je podatak tačan? Je li ažuran? Kompletan? Da li smo ga dobili na vreme? Nije dovoljno da sebi postavimo samo prvo pitanje kako bi podatke proglasili kvalitetnim. Kada odgovorimo na ovu, inače nepotpunu listu pitanja, zapravo analiziramo podatak sa različitih aspekata. Ili bolje rečeno, sagledavamo različite dimenzije kvaliteta podatka. U ovom članku ćemo objasniti ključne dimenzije kvaliteta podataka:
Tuesday, 1 June 2010
Monday, 10 May 2010
Dobra metrika? Bolje bi bilo da jeste!
Koliko često čujete izjave poput: "poslednji kvartal je bio uspešan", "veći deo posla je završen", "maloprodajni objekti uglavnom dobro posluju", "rukovodilac tog pogona odlično vodi posao", ... Svaka od ovih izjava nam poručuje da li je nešto dobro ili loše. Ali po kom kriterijumu? I čiji su to kriterijumi? Jesu li usaglašeni sa ciljevima preduzeća? Da bi informacije u prethodnim izjavama bile potpune, neophodno je da ih kvantifikujemo, tj. pretvorimo u metrike. Ali to nije jednostavno kao što može delovati na prvi pogled.
Monday, 3 May 2010
Kvalitet podataka - poslovni ili tehnološki problem
Verujem da u poslednje vreme često čujete termine data quality, data governance, master data management, ... Kako su ovi termini postali posebno popularni poslednjih godina, došlo je do najezde kompanija koje nude razna rešenja upravo iz pomenutih oblasti. Ukoliko je prisutno nepoznavanje materije, prirode projekta koji se uvodi u firmu i nedovoljna svest o realnim potrebama, čak ni proizvodi i usluge najboljih svetskih kompanija neće doprineti ostvarenju cilja. Dakle, razumevanje prirode projekta koji se uvodi je neophodan preduslov za kvalitetnu realizaciju istog.
Sa aspekta kvaliteta podataka, za sada je dovoljno reći da se podaci smatraju kvalitetnim ukoliko dovoljno dobro odslikavaju stanje u realnom svetu. Postoji više dimenzija kvaliteta podataka, ali o njima će biti više reči u zasebnom članku.
Mnoge organizacije nisu svesne nivoa kvaliteta svojih podataka ili su, još gore, svesne da im podaci nisu dovoljno dobri, ali ne prepoznaju kakve to gubitke ima za posledicu. Za primer ćemo uzeti slučaj sa jednog od mojih prethodnih angažovanja kao developer u banci na razvoju modula čija je funkcija trebala da bude automatsko štampanje adresa klijenata kojima je trebalo poslati pismo upozorenja pred utuženje (klijenti koji kasne sa otplatom određenog broja rata kredita). Iako, na osnovu definicije zahteva implementacija ovog modula deluje trivijalno, naišli smo na dva ozbiljna problema:
- Nepostojanje pripremljenih podataka o broju zakasnelih uplata kredita po klijentu
- Loši/nepotpuni podaci o adresama klijenata
U vreme o kom govorim BI sistem u pomenutoj banci nije bio implementiran, te su se izveštaji pravili prema potrebi uz modifikaciju postojećih. Obzirom na ovakav način rada, morali smo za svaki modul da razvijamo poseban upit kojim ćemo iz baze izvući potrebne podatke, a to zahteva znatno više vremena za izradu i testiranje. Samim tim je i podložnije greškama.Drugi problem je bio taj što podaci o adresama klijenata nisu bili potpuni. Sva pisma koja su poslata na netačne adrese predstavljaju čist gubitak u vidu potrošenog materijala, vremena za štampanje, kovertiranja i troškova slanja.
Iz navedenog, očigledno je da je problem kvaliteta podataka zapravo problem poslovnih korisnika u čije rešavanje je potrebno uključiti i IT odeljenje što proizvodi sledeće zaključke:
- poslovni korisnici su obavezni da definišu mere kvaliteta podataka i nivo prihvatljivosti; na primer, ukoliko je reč o firmi koja šalje veliki broj pisama, moguće je izračunati koliko pisama će se godišnje vratiti zbog pogrešne adrese i taj gubitak izraziti u novčanim jedinicama
- korist od povećanja kvaliteta podataka je najefiksanije izraziti u novčanim jedinicama kako bi se obezbedio sponzor za DQ projekat
- meriti samo ključne procese
- rad na kvalitetu podataka mora biti kontinualan proces jer jednokratno poboljšanje kvaliteta podataka ne donosi dugoročne efekte
- zadužiti osobu koja poznaje kako poslovne procese tako i podatke u sistemu za brigu o kvalitetu podataka; ovu ulogu često ne može da "pokrije" samo jedna osoba već je po poslovnim područjima potrebno imenovati najkompetentnije osobe za tu ulogu.
Wednesday, 10 March 2010
Da i mi kažemo nešto...
Danas bi svi nešto da kažu i svi imaju pravo da nešto kažu, bilo da je to Nešto sa velikim N ili pak nešto sa i i a umesto e i o :) Kako god, rezultat je isti...
GOMILA informacija.
Bitnih i nebitnih.
Istinitih i neistinitih.
Povezanih i bez ikakve veze.
...
I šta sad raditi sa tolikom količinom svega i svačega?
Čika Ajnštajn reče da informacija nije znanje. I bio je u pravu.
Ako teta spremačica kaže uglađenom bankaru da njen komšija Milovan ima kredit u "njegovoj" banci za njega je to samo informacija. Međutim, ako Milovan Pantelić star 35 godina, uzgajivač maline po zanimanju, ima kredit čija rata dospeva 05. septembra tekuće godine, a uglađeni bankar pored ovih sistemskih podataka ima informacije da godina nije bila rodna za malinu i Milovanova najmlađa kćerka polazi u prvi razred osnovne škole... hm... dobar bankar od ovog niza informacija može zaključiti da postoje velike šanse da Milovan u septembru neće platiti svoju ratu kredita na vreme i da banka mora računati na taj rizik. Naravno, nije jedan Milovan razlog da propadne banka, ali ako banka ima 10.000 Milovana onda joj ovo znanje može činiti razliku. Da, znanje... znanje koje je nastalo kao rezultat "igranja" informacijama.
Mi smo jedni od tih što vole da se "igraju" informacijama... da žongliraju :) Nadam se da ćete nam se pridružiti u ovoj "igri" da zajedno stvaramo nova znanja od postojećih informacija.
Neka igra počne...
GOMILA informacija.
Bitnih i nebitnih.
Istinitih i neistinitih.
Povezanih i bez ikakve veze.
...
I šta sad raditi sa tolikom količinom svega i svačega?
Čika Ajnštajn reče da informacija nije znanje. I bio je u pravu.
Ako teta spremačica kaže uglađenom bankaru da njen komšija Milovan ima kredit u "njegovoj" banci za njega je to samo informacija. Međutim, ako Milovan Pantelić star 35 godina, uzgajivač maline po zanimanju, ima kredit čija rata dospeva 05. septembra tekuće godine, a uglađeni bankar pored ovih sistemskih podataka ima informacije da godina nije bila rodna za malinu i Milovanova najmlađa kćerka polazi u prvi razred osnovne škole... hm... dobar bankar od ovog niza informacija može zaključiti da postoje velike šanse da Milovan u septembru neće platiti svoju ratu kredita na vreme i da banka mora računati na taj rizik. Naravno, nije jedan Milovan razlog da propadne banka, ali ako banka ima 10.000 Milovana onda joj ovo znanje može činiti razliku. Da, znanje... znanje koje je nastalo kao rezultat "igranja" informacijama.
Mi smo jedni od tih što vole da se "igraju" informacijama... da žongliraju :) Nadam se da ćete nam se pridružiti u ovoj "igri" da zajedno stvaramo nova znanja od postojećih informacija.
Neka igra počne...
Subscribe to:
Comments (Atom)