ANA SƏHİFƏKİTABƏVVƏLKİSONRAKI

Məlumatla işləyərkən əsas addımlar

Məlumat layihəsinə başlarkən başa düşməli olduğunuz 3 əsas məfhum vardır:

  • Məlumat üçün tələblər cavab vermək istədiyin suallardan başlmalıdır.

  • Məlumatlar çox vaxt qarışıq olur onları təmizləmək lazım gəlir.

  • Məlumatın sənədləşməmiş əlamətləri olur.

figs/incoming/05-MM.png
Şəkil 69. Qarışıq məlumat

Cavab vermək istədiyiniz sualları bilin

Bir çox hallarda məlumatla işləmək canlı mənbədən interviyu götürmək kimidir. Siz məlumçat haqqında suallar verirsiniz, və onlardan cavabların açılmasında istifadə edirsiniz. Lakin bir mənbə bir insana məlumatı yalnız malik olduğu malumata dair cavab lar verə bilər. Bir məlumat şəbəkəsi düzgün qeydləri və dəyişənləri olan suallara cavab verə bilir. Bu o deməkdir ki siz məlumatı əldə etməzdən öncə hansı suallara cavab verməli olduğunuzu nəzərə aımalısınız. Siz əsasən geriyə doğru işləyirsiniz. Əvvəlcə hekayənizdə məlumata əsaslanan arayışları yerbəyer edin. Sonra həmin arayışları hazırlamaq üçün hansı dəyişənləri və qeydləri əldə etməli və təhlil etməli olduğunuza qərar verin.
Yerli cinayət xəbərlərini özündə yerləşdirən bir nümunəni təsəvvür edirn. Belə deyək ki, siz öz şəhərinizdə baş vermiş cinayətlərə aid bir hekayə quraşdırmaq istəyirsiniz. Şəhərin müxtəlif hissələrində müxtəlif kateqoriyalı cinayətlərin baş verdiyi üçün vermək istədiyiniz arayışlara cinayətlərin daha çox baş verdiyi günlərin vaxtları, həftənin günləri də daxildir.
Gərək başa düşəsiniz ki, məlumat üçün sizin tələblərinizə hər bir cinayətin baş vermə tarixi, vaxtı, cinayətin növü (qətl, oğurluq, ev oğurluğu və s.) və cinayətin baş verdiyi ünvan daxil olmalıdır. Beləliklə, ayın tarixi, vaxt, cinayətin kateqoriyası, və ünvan sizin cavab verəcəyiniz minimum suallardır ki, si onlara cavab verməlidiniz.
Lakin xəbəriniz olsun ki, bir sıra maraqlı suallar da vardır ki, bu dörd dəyişənlı məlumat şəbəkəsi onlara cavab verə bilmir. Məsələn, qurbanların irqi və cinsi, və yaxud oğurlanmış əmlakın cəmi dəyəri və yaxud hansı məmurlar həbslərə daha çox maraq göstərirlər. Eyni zamanda, siz qeydləri müəyyən vaxt periodu üçün, məsələn son üç il ərzində baş verənləri, götürə bilərsiniz. Bu o demək olar ki, ondan daha uzun bir dövr üçün baş verən cinayətlər haqqında heç nə deyə bilməzsiniz. Həmin suallar sizin hekayəniz üçün planlaşdırdığınız sahədən kənarda qalır. Bu yaxşıdır. Lakin siz öz məlumatlarınızın təhlilinə girişmirsiniz və birdə qərara alırsınız ki, şəhərin müxtəlif hissələrində həbslər vasitəsilə cinayətlər neçə faiz açılmışdır.
Buradan belə nəticə çıxarmaq olar ki, məlumat bazasında hekayədə bütün suallara cavab verəcək bir məlumat yarım şəbəkəsini tələb etməkdənsə, bütün dəyişiklikləri və qeydləri tələb etmək daha yaxşı fikirdir. Əslində bütün məlumatı almaq (əgər bir proqramçıdan lazımı yarım şəbəkənin hazırlanması üçün bir təşkilata pul ödəməkdənsə), yarım şəbəkəni almaq daha ucuz başa gəlir. Siz özünüz də məlumatı yarım şəbəkəyə ayıra bilərsiniz və bu zaman siz öz yeni hekayələrinizdə daha çox yeni suallara cavab tapa bilərsiniz. Bəzən məxfilik qanunları və yaxud başqa qaydalara əsasən bəzi dəyişənlər, məsələn, qubanların adları, məxfi məlumatları verənlərin adları nəşr oluna bilməz. Lakin heç olmamaqdansa redaktə olunmuş məlumat bazasının hansı suallara cavab verə va yaxud verə bilməyəcəyini başa düşəndə qismən yaradılmış məlumat bazası daha yaxşıdır.

Qarışıq məlumatın təmizlənməsi

Məlumat bazası üzərinndə işin ən böyük problemlərindən biri odur ki, çox vaxt təhlil məqsədilə bürokratik səbəblərdən toplanmış materialdan istifadə etməli olursunuz. Problem ondan ibarətdir ki, bi iki tip materallar üçün səliqəlilik standartları tamailə müxtəlifdir.
Məsələn, cinayət hüququ sisteminin məlumat bazasında əsas funksiya ondan ibarətdir ki, müttəhim Counz həbsxanadan çıxarılıb gətirilib ki, dinləmə zamanı hakim Smitin qarşısında olsun. Bu məqsəd üçün Counzun doğum ilinin düzgün yazılıb yazılmamasının, və yaxud o küçənin adının düzgün hərflənməsinin və yaxuç onun ata adının düzgün olub olmamasının bir əhəmiyyəti yosdur. Deməli bu sistem hətta özündə olan bu naqisliklə, natamamlıqla da Counzun məhkəmə otağına müəyyən olunmuş vaxtda gətirilməsin təmin edir.
Lakin bu cür səhvlər data jurnalistin məlumat bazasında nümunələrin tapılması üçün etdiyi cəhdlərin istiqamətini dəyişə bilər. Bu səbəbdən, işin ilk böyük hissəsi yeni məlumat şəbəkəsi əldə edərkən onun nə qədər qarışıq olduğunu yoxlamaq və onu sahmana salmaqdan ibarət olmalıdır. Bu qarığıqlığı axtarmağın ən çevik yolu nisbətən kiçik dəyərlərə malik olması gözlənilən rəqəmlərdə kateqorial dəyişikliklərin tezlik cədvəllərinin yaradılmasıdır. (məsələn Exceldən istifadə edərkən siz bunu hər bir cateqorial dəyişiklik üçün Süzgəcdən və yaxud Pivot cədvəllərindən istifadə etməklə həll edə bilərsiniz.)
Götürək “Gender”-i, sadə bir misaldır. Orada görə bilərsiniz ki, gender sahəsinə çoz müxtəlif anlayışlar, dəyərlər daxildir: Kişi, Qadın, K,Q, KİŞİ, QADIN və s., buraya hətta səhv yazılmış “Qadı” vormasını da əlavə etmək olar. Dəqiq gender təhlili aparmaq üçün siz standartlaşdırmalısınız- K və Q üzərində qərar verməlisiniz, statndartlara uyğunlaşdırmaq üçün bütü dəyişik formaları dəyişdirməlisiniz. Bu cür problemləri olan başqa məlumat bazaları da vardır, məsələn, Amerikada kampaniyaların maliyyə hesabatları, orada “məşğulluq” sahəsində “hüquqşünas”, “vəkil”, “Şura üzvü”, “sınaq hüquqşünası”, Və bunların orfoqrafik cəhətdən səhv yazılmış variantları olur burada əsas yol budur ki, həmin terminlər standartlaşdırılsın və mümkün qədəq daha az variantla saxlanılsın.
“Jozeph T.Smith”, “Jozeph Smith”, “J.T.Smith”, “Jos Smith”, və “Joe Smith” kimi adlarla (bunlar eyni şəxsdlr!) işlərkən məlumatın təmizlənməsi daha problematic bir işə çevrilir. Bu başqa dəyişənlərdə də baş verə bilər, məsələn, ünvanın və yaxud doğum ilinin yazılması, və yaxud başqa qeydlərə dair daha dərin araşdırma aparılarkən bu cür hallar ola bilir. Lakin Google Saflaşdırmada olduğu kimi alətlərlə standartlaşdırmanı daha tez və çevik aparaq olar.

Məlumatların sənədləşməmiş əlamətləri ola bilər

Hər hansı bir məlumat bazasının Rozetta Stounu bir məlumat lüğətidir. Xüsusilə bu fayl (O PDF və yaxud cədvəl formasında ola bilər.) məlumat faylının necə formatlandığını sizə anladacaq (məhdudiyyətsiz mətn, sabit eni olan mətn, Excel, mBazası və s.) dəyişənlərin sırası hər bir dəyişənin adı, hər bir dəyişənin mlumat tipi, (mətn xətti, tam, onluq, və s.). Siz görəcəksiniz ki, bu məlumatdan istifadə sizə məlumatı təhlil proqramların cəlb etməkdə kömək edəcək (Excel, Access, SPSS, nüvə reaksiyaları cədvəlləri SQL-nın müxtəlif dadları və s.).
Məlumat lüğətinin başqa bir əsas elementi xüsusi dəyişənlərlə istifadə olunan kodların izahıdır. Məsələn, gender belə kodlaşdırıla bilər ki: “1= Kişi” və “0=Qadın”. Cinayətlər sizin yurisdiksiyanın statusuna görə hər bir cinayət üçün kodlaşdırıla bilər. Xəstəxanada müalicə qeydləri diaqnozlar və xəstənin müalicəsinin gedişi üçün yüzlərlə 5 rəqəmli kodlardan istifadə oluna bilər. Məlumat lüğəti olmadan bu məlumat şəbəkələrini keyfiyyətli təhlil etmək olmazdı.
Lakin əlində məlumat lüğəti olanda da problemlər ola bilər. Bir neçə il bundan öncə Mayamidə alkoqol zəhərlənməsi zamanı qəza törədən sürücülərə müxtəlif hakimlər tərəfindən müxtəlif cəzaların verilməsini araşdıran bir qrup jurnalistin başına belə bir iş gəlmişdi. Jurnalistlər məhkəmə sistemindən qeydləri almış üç fərqli cəza haqqında rəqəmləri məlumat lüğətindən istifadə edərək təhlil etmişlər. Onlar 3 əsas məlumatı- həbsxana müddətini, , məhbusluq müddətini və cərimlərin miqdarını müqayisə etmişlər. Müxtəlif hakimlərin verdiyi rəqəmlər arasında çox az fərq olmuş, lakin həmin rəqəmlər jurnalistlərə bəzi hakimlərin çox sərt, bəziləsinin isə ürəyi yumşaq olmaları haqqında dəlillər vermişdir.
Lakin hər bir hakim cinayət hallarının 1-2 faizinin həbs vaxtını, həbsxana müddətini və cərimə məbləğini göstərmirdi. Beləliklə məhkəmə hökmləri qrafikində çox az miqdarda “cəza verilmir” hokmü olurdu. Hekayə və qrafik çap olunanda hakimlər şikayətlənirdilər ki, Herald içkili olaraq maşın sürməyə görə hər bir kəsin cəzalandırılmalı olduğunu bilə-bilə onları ölkə qanunlarını pozmaqda ittiham edir. Beləliklə müxbirlər məlumat faylıdı düzəldən Məhkəmə dəftərxanasına gedərək nə üçün belə səhv etdiklərini soruşdular. Onlara deyildi ki, mübahisəli hallarda ilk dəfə həbs olunanlar var idi. Adi halda onlara cərimə tətbiq edilərdi. Lakin onların pulları yox idi. Beləliklə, hakimlər onları ictimai işlərə cəlb etdilər ki, yollarda zibilləri təmizləsinlər. Məlum oldu ki, cəza verilməsini tələb edən qanun məlumat bazası yaradıldıqdan sonra çıxmışdı və bütün məhkəmə qulluqçuları bilirdilər ki, həbs, həbsxana və cərimə haqqında dəyişənlərdəki sıfırlar ictimai xidmətə cəlb etmə deməkdi. Bu məlumat lüğətində qeyd edilmədiyindən Herald təkzib verməli olmuşdu.
Belə olduğu halda gərək məlumatı sizə verən təşkilatdan həmin məlumatın içərisində sənədləşməmiş elementlərin olub olmadığını, yeni yaradılmış və məlumat lüğətinə daxil edilmiş kodların oraya daxil edilib – edilmədiyini soruşasınız. Bundan başqa, həmişə təhlilin nəticələrini yoxlayın və özünüzə “Bu həqiqətə uyğundurmu?” sualını verin. Heraldın müxbirləri son müddət haqqında qrafik düzəldirdilər və əsasən diqqəti hər bir hakimin cəza verilmədiyini göstərmək üçün bəzi kişik faktları nəzərə almadıqlarını göstərmişdilər. Gərək onlar bütün hakimlərin hətta azacıq da olsa statin qanunlarını pozduqlarını özlərindən soruşaydılar .

Stiv Doig, Walter Kronkit, Arizona Dövlət Universitetinin Jurnalistika məktəbi

ANA SƏHİFƏKİTABƏVVƏLKİSONRAKI