ANA SƏHİFƏKİTABƏVVƏLKİ

Məlumatda anlayışları tapmaq üçün əyaniləşdirilmə vasitəsindən istifadə

Məlumatın təhlili üçün əyaniləşdirmə əsasdır. O hücumun ön xəttini təmin edir. Məlumatın başqa heç cür həzm oluna bilməyəcək mübahisəli quruluşunu açıqlayır. Biz təsəvvür edilməyəcək effectlər aşkar edirik və təsəvvür edilə bilənləri açıqlayırıq.

— Uilyam S. Clivlend: Məlumatı əyaniləşdirərkən

Bitlərdən və baytlardan ibarət olan, kompüterlərin sərt disklərində fayllarda saxlanan məlumat özü gözə görünməzdir. Onu görmək və məlumatın məzmununu aşkar etmək üçün biz gərək onu əyaniləşdirək. Bu fəsildə mə çalışacağam ki, hətta məlumatın text formasını da özündə ehtiva edən əyaniləşdirmə termini haqqında daha geniş danışım. Məsələn məlumat şəbəkəsini cədvəl proqramına yükləmək özü də əyaniləşdirmə hesab edilə bilər. Gözə görünməz məlumat bir anın oiçində ekranda görünən bir şəkilə çevrilir. Beləliklə, məsələ heç də ondan ibarət olmamalıdır ki, jurnalistlərin məlumatı əyaniləşdirmələrinə ehtiyac vardır və ya yoxdur, əsas məsələ müəyyən situasiyada hansı növ əyaniləşdirməyə ehtiyac olmasındadır.
Başqa sözlə, cədvəl əyaniləşdirməsindən istifadə nə vaxt bir əhəmiyyət daşıyır? Qısa cavab belədir: demək olar ki, hər bir vaxt. Cədvəllər özlüyündə bizə məlumat şəbəkəsi haqqında kifayət qədər məlumat vermir. Eyni zamanda cədvəllər özlüyündə məlumat içərisindəki nümunələ\ri birbaşa təyin etməyə imkan vermir. Burada ən geniş yayılmış olanlar coğradi məlumatlardır. Bu məlumatları yalnız xəritə üzərində əyaniləşdirəndə müşahidə etmək mümkün olur. Bundan baqa digər formada nümunələr də vardır ki, biz onlardan bu fəsildə bəhs edəcəyik.

Anlayışların üzə çıxarılmasında əyaniləşdirmədən istifadə

Məlumatın əyaniləşdirilməsi alətlərindən və metodlarından məlumat şəbəkələrindən hazır hekayələrin çıxarılmasını gözləmək qeyri realdır. Bizdə belə hekayəyə təminat verən qaydalar və “protokol” yoxdur. Lakin mən düşünürəm ki, əvəzində “anlayışlar”ın axtarılıb tapılması bacarıqlı jurnalislərin əllərində nəfis şəkildə yaradılan hekayələrə çevrilməsində böyük əhəmiyyət daşıyır.
Hər bir yeni əyaniləşdirmə bizim məlumatımıza müəyyən anlayışlar verir. O anlayışlardan bəziləri tamamilə yeni olaraq bizi təəccübləndirsə də, bəziləri artıq məlum ola bilər (hələ sübut olunmamış da ola bilər). O anlayışların bəziləri hekayənin başlanğıcı mənasını verə bilər, bəziləri isə, əyaniləşdirilmə zamanı məlumatın içərisindəki səhvlərin nəticəsi də ola bilər
Məlumatların içərisindəki anlayışların tapılmasını daha effektiv etmək üçün mən aşağıdakıları çox faydalı olduğunu görürəm.

figs/incoming/05-BB.png
Şəkil 71. Məlumat anlayışları: Əyaniləşdirmə (Gregor Aisch)

Bu addımların hər biri bu bölmədə sonra müzakirə ediləcəkdir.

Məlumatı necə əyaniləşdirməli

Əyaniləşdirmə məlumat şəbəkəsinə dair yeganə perspektivi təmin edir. Məumatı ço müxtəlif yollarla əyaniləşdirmək mümkündür.
Nisbətən az həcmdə məlumat bəndləri ilə işlərkən cədvəllər çox güclüdür. Onlar yarlıkları və məbləğləri çox struktur və mütəşəkkil formada göstərir və məlumatın növlərə ayrılması və süzgəcdən keçirilməsi zamanı özlərinin potensialını tam şəkildə göstərə bilirlər. Bundan başqa, Eduard Taft təklif etmişdir ki, cədvəlin sütunları arasına kiçik qrafik elementləri daxil etməklə , məsələn hər sırada bir xətt daxil etmək olar. (parıldayan xətt kimi də tanınır). Lakin girişdə qeyd edildiyi kimi, cədvəllərin müəyyən məhdudiyyətləri vardır. Onlar bir ölçülü tullantıları göstərərkən yuxarı 10-luq qədər çox güclü, eyni zamanda çox ölçüləri müqayisə edərkən isə zəif görünür. (müəyyən vaxt ərzində hər bir ölkə üzrə əhalinin sayı.) .

figs/incoming/05-BC-graphical-table.png
Şəkil 72. Taftdan məsləhətlər: Parıldayan xətlər (Gregor Aisch)

Qrafiklər ümumiyyətlə sizə məlumatınızdakı həndəsi fiqurların əyani keyfiyyətlərinin ölçülərini xəritələyə bilər. Fərdi əyani keyfiyyətlərin təsirliliyi haqqında çox yazılmışdır. Və qısa versiya bundan ibarətdir ki, rənglər çətindir, vəziyyət hər şeydir. Məsələn bir yayılma diaqramında iki ölçü X və Y vəaiyyətinə qoyulmuşdur. Siz nümayiş olunan simvolların rəng və ülçüsünə hətta üçüncü ölçünü də göstərə bilərsiniz. Xətti qrafiklər hətta müvəqqəti təkamülü də göstərə bilir, ancaq plitəşəkilli qrafiklər kateqoriyalar üzrə məlumatları müqayisə etmək üçün yaxşıdır. Siz qrafik elementləri bir bi birinin üstünə qoya bilərsiniz.
Əgər məlumatınızda az saylı qrupları müqayisə etmək istəyirsinizsə, bilin ki, eyni qrafikin bir neçə əlamətini göstərmək çox güclü bir metoddur. Bütün qrafiklərdə məlumatınızdakı müxtəlif aspektləri tədqiq etmək üçün müxtəlif şkalalardan istifadə edə bilərsiniz. (xətti və yaxud loq şkaladan).
Əslində bizim bəhs etdiyimiz məlumatın çox hissəsi bie növ real adamlarla əlaqədardır. Xəritələrin gücü məlumatları bizim real fiziki dünyamızla yenidən əlaqələndirməkdədir. Geo yerləşdirilmiş cinayət hadisələr haqqında məlumat şəbəkəsini təsəvvür edin. Siz əsasən, cinayətlərin harada baş verməsini görmək istəyəcəksiniz. Xəritələr eyni zamanda məlumatın içərisində cinayətlərin arasında şimaldan cənuba, şəhərdən kəndə əlaqələrin olduğunu göstərə bilir.

figs/incoming/05-BD-choropleth.png
Şəkil 73. Cloropet (rənglərdən təşkil olunan xəritələr)(Gregor Aisch)

Əlaqələrdən danışarkən qeyd etmək lazımdır ki, əyaniləşdirmənin dördüncü ən vacib növü qrafikdir. Qrafiklər sizin məlumatlarınızda bütün daxili əlaqələri (bağları) göstərir. Bağların vəziyyəti qrafiki əmələ gətirən alqoritmlərlə hesablanır. Bu şəbəkənin içərisində strukturu dərhal görməyə imkan verir. Ümumiyyətlə qrafika ilə əyaniləşdirmə metodu şəbəkənin özünü modelləşdirmək üçün istifadə olunan bir üsuldur. Heç də bütün məlumat şəbəkələri bütün əlaqələri özündə ehtiva etmir, bəziləri etsə də bu o qədər maraqlı bir mərhələ olmur. Bəzən jurnalist özü bağlar arasındakı hədləri özü müəyyən etməlidir. Buna misal olaraq U.S. Senate Social Graph-ı göstərmək olar ki, öz hüdüdları ilə səslərin 65%-ni toplayan senatorları əlaqələndirir.

figs/incoming/05-BE-graph.jpg
Şəkil 74. Senatın social şəbəkəsi (slate.com)

Gördüklərinizi təhlil və şərh edin

Məlumatınızı əyaniləşdirdikdən sonra növbəti addım yaratdığınız şəkildən nə isə öyrənməkdir. Özünüzdən soruşa bilərsiniz.:

  • Bu təsvirdə mən nə görə bilirəm? Bu mənim gözlədiyimdir?

  • Burada maraqlı nümunələr varmı?

  • Məlumat kontekstində bu nə deməkdir?

Bəzən elə ola bilər ki, əyaniləşdirməni başa çatdırdıqdan sonra görərsən ki, nə qədər gözəl olsa da məlumat haqqında heç nə demir. Lakin hər hansı bir əyaniləşdirmədən sonra orada cüzi də olsa öyrənməyə nə isə olur..

Öz başladıqlarınızı və addımlarınızı sənədləşdirin

Əgər siz bütün prosesi öz məlumat şəbəkəniz boyunca bir səyahət hesab edirsinizsə, sənədləşmə sizin səyahət gündəliyiniz placaq. O sizə haraya səyahət etmiş olduğunuzu, orada nə gördüyünüzü, növbəti addımlar üçün nəyi qərara aldığınızı deyəcək. Məlumata baxmadan heç sənədləşməyə başlaya da bilməzsiniz. Əksər hallarda biz əvvəlcədən tanış olmadığımız məlumat şəbəkəsi ilə işə başlayanda məlumat haqqında çoxlu gözləntilərimiz, ehtimallarımız olur.Adətən bizim müəyyən bir məlumat şəbəkəsinə baxmaqla maraqlanmağımızın bir səbəbi olur. Sənədləşməyə ilkin fikirləri yazmaqla başlamaq gözəl ideyadır. Bu bizə öz niyyətimizi müəyən etməyə kömək edir və tapmaq istədiyimiz məlumat bazasını müəyyənləşdirməyi səhv başa düşmək riskimizi azaldır.
Mən həqiqətən düşünürəm ki, sənədləşdirmə bu prosesin ən vacib hissəsidir. Bu həm də bizim üstündən vaz keçdiyimiz bir işdir. Aşağıdakı misalda görəcəyiniz kimi, təsvir etdiyimiz proses çoxlu mövzu gətirir və məlumat üzərində işi canlandırır. Yaratdığınız 15 qrafikdən ibarət şəbəkəyə baxarkən, xüsusilə də bir qədər vaxt keçdikdən sonra çaşa bilərsiniz. Əslində həmin qrafiklər (sizin və bu işdə sizinlə birlikdə maraqlananlar üçün ) çox dəyərlidir. Beləliklə, siz vaxt sərf edərək aşağıdakılara bənzər qeydlər edə bilərsiniz:

  • Mə bu qrafiki nə üçün yaratdım?

  • Bunu yaratmaq üçün mən məlumata nə etdim?

  • Bu qrafik mənə nə deyir?

Məlumatı çevirin

Təbii ki, sonuncu əyaniləşdirmələrdən sonra bilik və bacarıqlara görə ola bilsin ki, daha sonra nəyi görmək istəməyiniz ideyası doğacaq. Ola bilsin ki, məlumat şəbəkəsində maraqlı nə isə tapasınız və onu detallarına qədər araşdırmaq istəyəsiniz.

Mümkün çevrilmələr aşaqıdakılar ola bilər:

Miqyasın dəyişməsi

Əyaniləşdirmədə müəyyən detala baxmaq Aggregation Toplama, Yığma. Müxtəlif məlumatları bir tək qrupda biləşdirmək

Süzgəcdən keçirmə

Əsas diqqət mərkəzimizdə olmayan məlumat hissələrini (müvəqqəti) silmək

Çıxıntıların silinməsi

Məlumat şəbəkəsini 99% təmsil etməyən çıxıntılardan yaxa qurtarmaq.

Gəlin belə hesab edək ki, siz bir qarfik yaratmısınız və oradan düyünlər yığınından və yüzlərlə çıxıntıdan (adətən sıx əlaqəli şəbəkələri əyaniləşdirəndə belə şeylər baş verir) lazım olan heç bir şey çıxmayıb. Bu zaman bir çevrilmə addımı ilə çıxıntıların bir neçəsini süzgəcdən keçirmək olur.
Məsələn çıxıntılar donor ölkələrdən alıcı ölkələrə pul axınını göstərir, bu zaman biz aşağıdakı axınları silməklə müəyyən məbləği sildik.

Biz hansı alətlərdən istifadə edirik?

Alətlər məsələsi heç də asan məsələ deyil. Məlumatın əyaniləşdirilməsi üçün hər bir alət bir şey üşün yaxşıdır. Əyaniləşdirmə və məlumatın araşdırılması asan və ucuz olmalıdır. Əgər əyaniləşdirmə patametrlərinin dəyişdirilməsi saatlarla vaxt aparırsa, siz bunu sınaqdan keçirməyəcəksiniz. Bu heç də o demək deyil ki, sizin həmin aləti öyrənməyinizə ehtiyac yoxdur. Ancaq siz onu öyrəndikdən sonra o çox səmərəli olmalıdır.
Çox vaxt elə alət seçmək lazım gəlir ki, o həm məlumatın araşdırılması, həm də əyaniləşdirmə məsələlərini özündə ehtiva edir. Tapşırıqları alətlərin müxtəlifliyinə görə ayırmaq o demək olur ki, siz çox vaxt məlumatı idxal və ixrac edirsiniz. Məlumatın əyaniləşdirilməsi və araşdırılmasına dair bir neçə alət göstərək:

  • LibreOffice, Excel or Google Docs kimi cədvəllər

  • R (r-project.org) or Pandas (pandas.pydata.org) kimi statistic proqramlaşdırma üzrə çərçivə işləri

  • Coğrafi İnformasiya Sistemləri (GIS) məsələn, Quantum GIS, ArcGIS, GRASS

  • d3.js kimi əyaniləşdirmə kitabxanaları (mbostock.github.com/d3), Prefuse (prefuse.org), Flare (flare.prefuse.org)

  • Məlumatın araşdırılması alətləri: Google Refine, Datawrangler

  • Əyaniləşdirmə üçün Qeyri-Proqram Təminatı , məsələn: ManyEyes, Tableau Public (tableausoftware.com/products/public)

Növbəti bölmədəki nümunə əyaniləşdirmələri R-an istifadə edilərək yaradılmışdır ki, ona Məlumatı əyaniləşdirmənin İsveç Ordu bıçağı da deyirlər.

Misal: ABŞ-da seçki məlumatlarının məğzi

Gəlin, ABŞ-da Prezident seçkiləri kompaniyasının maliyyə məlumat bazasına nəzər salaq. Burada ABŞ prezidentliyinə namizədlərə edilmiş təxminən 450 000 töhfə haqqında məlumat vardır. CSV faylı formatında olan məlumat 60 meqabaytdır və Excell proqramında onu araşdırmaq uzun bir işdir.
İlk addımda mən FSK (Federal Seçki Kompaniyası) –na edilən töhfələr haqqında məlumat şəbəkəsi haqqında ilkin ehtimallarımı qeyd edəcəyəm:

  • Edilmiş töhfələrin çoxunu Obama alır (Çünki o prezidentdir və daha çox məşhurdur)

  • Seçki yaxınlaşdıqca ianələrin miqdarı çoxalır

  • Obama Respublikaçı namizədlərə nisbətən daha çox kiçik ianələr alır.

Birinci suala cavab vermək üçün biz məlumatı çevirməliyik. Edilmiş hər bir ianənin əvəzinə biz hər bizr namizət üşün edilmiş ianələri toplayaq. Nəticələri əyaniləşdirdikdən sonra xüsusi cədvəldə biz Obamanın daha çox pul ayırması haqqında ehtimallarımızı təsdiq edərik.

Candidate Amount ($)

Obama, Barack

72,453,620.39

Romney, Mitt

50,372,334.87

Perry, Rick

18,529,490.47

Paul, Ron

11,844,361.96

Cain, Herman

7,010,445.99

Gingrich, Newt

6,311,193.03

Pawlenty, Timothy

4,202,769.03

Huntsman, Jon

2,955,726.98

Bachmann, Michelle

2,607,916.06

Santorum, Rick

1,413,552.45

Johnson, Gary Earl

413,276.89

Roemer, Charles E. Buddy III

291,218.80

McCotter, Thaddeus G

37,030.00

Bu cədvəl minimum və maksimum məbləğləri və sıranı göstərsə də, namizədlərin reytinqi haqqında heç nə demir. (Şəkil 75) məlumatın başqa cür görünüşüdür. Diaqram nöqtəli diaqramdır, cədvəldə hər şey göstərilib və üstəgəl verilmiş sahədə nümunələr verilib. Məsələn nöqtəli qrafik bizə Obama və Romni arasında, Romni və Perri arasında məsafəni dəyərləri çıxmadan birbaşa müqayisə etməyə imkan verir. (Qeyd: nöqtəli diaqram R-dan istifadə edilərək yaradılmışdı. Bu fəslin sonunda siz mənbə kodlarına linkləri tapa bilərsiniz)

figs/incoming/05-CC.png
Şəkil 75. Alt nümunələri göstərmək üçün əyaniləşdirmələr (Gregor Aisch)

İndi gəlin, məlumat şəbəkəsinin daha böyük bir şəkli ilə davam edək. İlk addımda mən töhfə verilmiş bütün məbləğləri sadə bir şəkildə əyaniləşdirdim. Biz görə bilirik ki, üç böyük çıxıntıdan başqa bütün məbləğlər müqayisə olunduqda kiçik ianələrdir. Sonrakı araşdırmalar göstərdi ki, bütün böyük töhfələr “Obama Qələbə Fondu-2012”-dən gəlir. (həm də Super Pack kimi tanınır) və iyunun 29 –- da 450 dolar, Sentyabrın 29-da 1,5 milyon, dekabrın 30-da 1,9 milyon olmuşdur.

figs/incoming/05-DD.png
Şəkil 76. Üç aydın çıxıntı (Gregor Aisch)

Yalnız SuperPAC-dan gələn töhfələr şübhəsiz ki, bu məlumatın işərisində ən böyek hadisədir və ona diqqət yetirməyinə dəyər. Məsələ ondadır ki, ayrı-ayrı fərdlərdən gələn kiçik ianələr fonunda bu böyük töhfələr görünüşcə bizi narahat edir və biz onu məlumatdan silirik. Bu çevrilmə çıxıntıların silinməsi kimi tanınır. Yenidən əyaniləşdirdikdən sonra biz görürük ki, ianələrin çoxu 10 dollarla 5 dollar arasındadır.

figs/incoming/05-EE.png
Şəkil 77. Çıxıntıların silinməsi (Gregor Aisch)

FECA tərəfindən yerləşdirilmiş ianələrin məhdudluğuna gğrə fərdlərə hər namizəd üçün 2500 dollardan artıq töhfə vermək olmaz. Məzmundan gördüyümüz kimi, həmin limitdən çox olan çoxlu sayda ianələr də vardır. Xüsusilə, May ayında edilmiş iki böyük töhfə diqqətimizi cəlb edir. Görünür, onlar iyun və iyulda mənfi məbləğlərdə əks olunur. Məlumatın sonrakı araşdırılması aşağıdakı əməliyyatları aşkar edir:

  • Mayın 10-da San Fransiskolu, Banneker Partners-də (vəkil) işləyən Stephen James Davis Obamaya 25 800 dollar yardım etmişdir.

  • Mayın 25-də Little Rock-da Murphy Qrupunda çalışan (İctimai Əlaqələr şöbəsində) Cynthia Murphy Obamaya 33 300 dollar yardım etmişdir

  • İyunun 15-də 30,800 dollarlıq məbləğ Syntiya Mörfiyə qaytarılmış və o məbləği 2500 dollaradək azaltmışdır

  • İyulun 8-də 25 800dollarlıq məbləğ Stephen James Davis-ə qaytarılmış və o yardımın məbləğini 0-a endirmişdir.

Bu rəqəmlərdə maraqlı olan nədir? Sintiya Mörfiyə qaytarılmış 30 800 dollar ayrı ayrı fərdlərin milli siyasi partiya üçün bir ildə verə biləcəyi maksimum məbləğə bərabərdir. Bəlkə də o iki illik məbləği bir əməliyyat keçirmək üçün birləşdirmişdir. Ceyms Devisə qaytarılmış 25 800 dollar – 5000 dollar hər hansı başqa bir siyasi komitəyə ödənilə biləcək məbləğdir.
Axırıncı məmunda aşkar etdiyimiz başqa maraqlı bir şey o oldu ki, respublikaçı namizədlərə verilən töhfələr 5000 və 2500 dollar arası bir üfiqi xətdə yerləşir. Onları daha yaxşı görə bilmək üçün mən respublikaçılara edilən yardımları əyaniləşdirdim. Nəticədə alınan qrafik elə parlaq bir nümunəni göstərir ki, məlumatın əyaniləşdirilməsi olmadan mümkün olmazdı.

figs/incoming/05-FF.png
Şəkil 78. Çıxıntıların silinməsi 2 (Gregor Aisch)

Görə biləcəyimiz odur ki, Respublikaçı namizədlərə 5000 dollarlıq yardımlar çoxdur. Əslində məlumatların təhlillərinə baxanda görürük ki, 1243 yardım yardımların ümumi sayının yalnız 0,3 %-ni təşkil edir. Həmin yardımlar vaxt bölgüsünnə görə bərabər yayıldığına görə burada vaxt xətti görünür. Bu xətdə maraqlı olan odur ki, fərdıərin yardımları 2500 dollara qədər məhdudlaşdırılır. Əlbəttə buna görə də müəyyən olunmuş həddən yuxarı məbləğ donorlara geri qaytarılır. Və nəticədə ikinci vaxt xətti 2500 dollar üçün görünür. Ancaq, Barak Obamaya edilən yardımlar buna bənzər nümunələrlə ğörünmür.

figs/incoming/05-GG.png
Şəkil 79. Çıxıntıların silinməsi 3 (Gregor Aisch)

Çox maraqlıdır ki, nə üçün Respublikaçıların minlərlə donorları fərdlər üçün edilmiş məhduduyyətləri görmədilər? Bu mövzunu daha bir də təhlil edəndə hər namizədə 5 dollarlıq yardımların sayını görürük.

figs/incoming/05-HH.png
Şəkil 80. Hər bir namizədə edilən yardımlar (Gregor Aisch)

Əlbəttə, bu bir qədər təhrif olunmuş görünüşdür. Çünki, bu hər bir namizədin almış olduğu ümumi məbləğı nəzərə almır. Sonrakı məzmun hər bir namizədə edilmiş 5 dollarlıq yardımın ümumi ümumi faizini göstərir.

figs/incoming/05-II.png
Şəkil 81. Senatorun pulu haradan gəlir?: Hər bir namizədə edilən yardımlar (Gregor Aisch)

Buradan nəyi öyrənməli?

Çox vaxt məlumat şəbəkəsinin əyani təhlili naməlum bir ölkəyə həyəcanlı bir səyahətə bənzəyir.Siz sadəcə bir əcnəbi kimi bir məlumatınız, bir də öz gümanlarınızla çıxırsınız. Hər bir addım atdıqca, hər bir qrafiki uyğunlaşdırdıqca, mövzu haqqında daha bir şey öyrənirsiniz. Bu baxışlara söykənərək növbəti atacaq addımlarınız haqqında daha hansı məsələlərin tədqiqata ehtiyacı olması barədə qərrlar verirsiniz. Bəlkə də bu fəsildə sizə rast gəlmişdir, bu əyaniləşdirm, təhlil və çevrilmə prosesi demək olar ki, qeyri müəyyən şəkildə təkrarlana bilər.

Mənbə kodunu alın

Bu fəsildə göstərilən bütün qrafiklər gözəl və güclü proqram təminatı olan R vasitəsilə yaradılmışdır. Əsasən elmi əyaniləşdirmə aləti kimi yaradılmışdır. R-də qurulmayan hər hansı bir əuaniləşdirmə və araşdırma aləti tpmaq çox çətindir. R-dan istifadə edərək yeni əyaniləşdirmə və araşdırma aləri olə maraqlananlar üçün bu fəsildə yaradılmış qrafiklərin mənbə kodlarını veririk. Bundan başqa, geniş sayda kitablar və təlimatlar da əlçatardır.

Gregor Aisch, Açıq Bilik Fondu

ANA SƏHİFƏKİTABƏVVƏLKİ