MCA-PRESS | Këshilla për ndërtimin e një baze të dhënash (database) për investigime
1348
post-template-default,single,single-post,postid-1348,single-format-standard,ajax_fade,page_not_loaded,,qode-title-hidden,qode_grid_1300,hide_top_bar_on_mobile_header,qode-content-sidebar-responsive,qode-theme-ver-16.6,qode-theme-bridge,disabled_footer_bottom,wpb-js-composer js-comp-ver-5.5.1,vc_responsive,elementor-default,elementor-kit-2266

Këshilla për ndërtimin e një baze të dhënash (database) për investigime

Në fillim të këtij viti, ndërsa kombi i Kolumbisë u trondit nga protestat, konfrontimet e armatosura dhe akuzat për abuzim të policisë me pushtetin, gazetarët u përpoqën të mbanin gjurmët e ngjarjeve.

Ndërsa kriza u përshkallëzua, disa media të pavarura dhe organizata të të drejtave të njeriut filluan të ndërtojnë bazat e tyre të të dhënave për të regjistruar vdekjet e lidhura me protestat, të cilat OJQ të ndryshme arritën në më shumë se 70 deri në fillim të korrikut. Ata gjithashtu filluan të regjistrojnë akuzat në lidhje me abuzimin me pushtetin, dhunën dhe arrestimet e protestuesve.

Një bazë e tillë e të dhënave u krijua nga Rutas del Conflicto-Routes of Conflict-një organizatë e mediave dixhitale që normalisht përdor teknika investigative dhe të gazetarisë së të dhënave për të mbuluar konfliktin e armatosur 50-vjeçar të Kolumbisë. Në fillim të këtij viti, grupi filloi të mbulonte dhunën në lidhje me protestat, të cilat filluan mbi një reformë të propozuar tatimore, por u shndërruan në protesta më të përgjithshme anti-qeveritare.

Të udhëhequr nga gazetari carscar Parra, një ekip reporterësh, studentë të gazetarisë, një zhvillues dhe një projektues grafik ndërtuan një bazë të dhënash për të regjistruar vdekjet gjatë protestave që tronditën qytetet në të gjithë vendin.

Duke mbledhur dhe konfirmuar informacione nga ngjarjet e përditshme, raportet e shtypit, OJQ -të dhe intervistat me dëshmitarët dhe të afërmit e viktimave, ky ekip ishte në gjendje të krijojë një bazë të dhënash të verifikuar të dhunës. Kjo i lejoi ata të hartonin ngjarjet dhe të eksploronin se cilët ishin viktimat, ndërsa analizonin rrethanat rreth vdekjes së tyre dhe ekspozonin se si brutaliteti policor ishte pas shumë incidenteve.

Kjo nuk ishte hera e parë që Parra kishte krijuar një bazë të dhënash që mund të përdoret për gazetari. Në fakt, Rutas del Conflicto u lançua në vitin 2012 kur ai po mbulonte një proces të drejtësisë kalimtare, në të cilin ish -paraushtarakët dhanë dëshmi për rolin e tyre në luftën e Kolumbisë kundër Forcave të Armatosura Rebele të Kolumbisë, FARC.

Parra kuptoi se dëgjimet shpesh zbulonin detaje rreth masakrave në të cilat civilë dhe luftëtarë të armikut ishin vrarë. “Pra, mendova se do të ishte mirë të gruposh të gjithë atë informacion në një bazë të dhënash për të provuar të krijosh mjete hartimi dhe afate kohore,” thotë ai, duke shtuar se historitë individuale në lidhje me secilën paraqitje në gjykatë nuk arritën të krijojnë një pamje të plotë të asaj që po ndodhte në ashtu siç mund të kishte një hartë.

Parra përdori njohuritë e tij si inxhinier i sistemeve – karrierën e tij të mëparshme – dhe pasionin e tij për gazetarinë hulumtuese për të trajnuar një grup studentësh, dhe kërkoi fonde për fazën e parë të Rutas del Conflicto, e cila do të vazhdonte të fitonte Çmimin e Gazetarisë së të Dhënave 2017 për uebfaqja më e mirë e gazetarisë së të dhënave.

Ekipi që atëherë ka ndjekur të njëjtat hapa për të mbledhur, organizuar dhe përpunuar të dhëna se si viktimat e konfliktit u zhdukën me forcë në lumenjtë në të gjithë vendin, dhe marrëdhënien midis dhunës në Kolumbi dhe mosmarrëveshjeve mbi pronën mbi tokën.

Redaksitë në të gjithë botën po ndërtojnë bazat e tyre të të dhënave kur përballen me mungesën e të dhënave zyrtare, ose kur të dhënat në dispozicion nuk janë të besueshme. Të tjerët i kanë krijuar ato si një burim raportimi ose hetimi ndërsa ndodhin ngjarje, ose kur është e nevojshme të kontrollohen burime të ndryshme informacioni.

“Të mos kesh të dhënat që të duhen në dorë nuk është një arsye për të mos treguar një histori që beson se mund të jetë e dobishme për publikun,” thotë Romina Colman, një eksperte e gazetarisë argjentinase të të dhënave dhe Redaktore e të dhënave në Amerikën Latine në Raportimin e Krimit të Organizuar dhe Korrupsionit Projekti (OCCRP).

Ndërsa gazetarët hulumtues mund të hasin informacione në të gjitha llojet e formateve – raporte PDF, regjistrime të çrregullta, intervista dhe vëzhgime të reporterëve, skedarë të skanuar, dokumente të shkruara me dorë, arkiva të vjetër – me ekspertizën e duhur të gjithë ata mund të transformohen në baza të dhënash të përpunueshme.

Këtë e mësova në vitin 2009, kur punova në krijimin e një baze të dhënash me anëtarin e GIJN Consejo de Redacción (CdR), shoqata e gazetarëve investigativë në Kolumbi. Ne donim të ndërtonim një bazë të dhënash për partnerët gazetarë që do t’i ndihmonte ata të hetonin zyrtarët publikë dhe korrupsionin. Në atë kohë, mjetet për nxjerrjen e të dhënave nga dokumentet ishin të pakta. Gazetaria e të dhënave sapo kishte filluar në Kolumbi, dhe ne mund të merrnim vetëm informacion të kufizuar në formate dixhitale të menaxhueshme nga qeveria.

Kështu filluam duke transkriptuar qindra dokumente letre, shumë prej tyre të shkruara me dorë, në të cilat zyrtarët publikë deklaruan konfliktin e tyre të interesave dhe donatorët e fushatës së tyre. Ne përfunduam me një koleksion prej më shumë se 2 milion regjistrimesh disa vjet më vonë, pasi shtuam të dhëna të tjera të lidhura nga mbi 20 burime zyrtare. Kjo çoi në një numër ekspozimesh të sjelljeve të pahijshme politike, si ky për rishpërndarjen e dyshimtë të tokës, nga revista kryesore hetimore Semana.

Në vitin 2011, ndërsa menaxhimi dhe analiza e të dhënave po fitonte terren si një teknikë gazetarie, Kolumbia u bashkua me Partneritetin e Qeverisë së Hapur, një nismë globale e nënshkruar nga 78 vende për të përmirësuar transparencën. Kjo më lejoi mua dhe ekipin tim të vazhdojmë krijimin e bazave të të dhënave për të treguar historitë përkatëse. Njëri u fut në lidhjet midis kontrolluesve lokalë – zyrtarëve publikë të ngarkuar me mbikëqyrjen e punës së kryebashkiakëve dhe guvernatorëve – dhe vetë njerëzve që supozohej se do të vëzhgoheshin. Një tjetër analizoi se kush financoi fushatat presidenciale dhe të kongresit në 2018 duke kontrolluar raportet e kandidatëve me kontratat publike, regjistrat e kompanive dhe të dhënat historike të zyrtarëve publik vendas.

Ndërsa gazetarët kanë ndërtuar baza të të dhënave që nga vitet 1980, vitet e fundit teknologjia për nxjerrjen e të dhënave nga faqet e internetit, konvertimin e PDF -ve ose skedarëve të skanuar në formate të redaktueshme dhe kombinimin e sasive të mëdha të të dhënave është shfaqur dhe është bërë më e arritshme. Një numër në rritje i reporterëve kanë marrë trajnime në atë që dikur quhej raportim i ndihmuar nga kompjuteri-tani i njohur si gazetari e të dhënave-dhe bashkëpunimet midis gazetarëve dhe zhvilluesve ose inxhinierëve të kompjuterave janë rritur, duke e bërë më të lehtë dhe më të realizueshme ndërtimin e bazave të të dhënave për qëllime gazetareske.

Në nivel global, redaksitë kanë krijuar baza të të dhënave për të hetuar asetet e sekuestruara nga kriminelët në Itali, vdekjet mashtruese dhe përdorimin e forcës nga policia në Shtetet e Bashkuara, si dhe për të bashkëpunuar me hetimet transnacionale. Kohët e fundit, një grup gazetarësh nga 12 vende ndërtuan një bazë të dhënash me informacione që nuk ishin sistemuar kurrë më parë, duke përfshirë 2,460 raste të dhunës kundër mbrojtësve të të drejtave mjedisore në Amerikën Latine. Grupi më pas publikoi 36 raporte hetimore në lidhje me këtë grup të dhënash në një projekt të veçantë të quajtur Toka e Rezistencës (Tierra de Resistentes).

Në anën tjetër të botës, OCCRP fitoi Çmimin Sigma 2020 për hetimin e saj të Lavanderisë Troika, në të cilën ekipi përdori teknologjinë më të avancuar për të nxjerrë të dhëna për mbi 1.3 milion transaksione nga qindra regjistrime bankare. Kjo vepër zbuloi sesi oligarkët dhe politikanët rusë investojnë fshehurazi milionat e tyre të fituara jashtë vendit, pastrojnë para dhe shmangin taksat.

Këto projekte janë të dukshme për grumbullimin e të dhënave që nuk ishin të disponueshme për publikun ose nuk ishin mbledhur në mënyrë qendrore për të rrëfyer histori që kishin një ndikim të madh, por të cilat nuk do të ishin të mundshme pa bazat e të dhënave që i lejonin reporterët të gërmonin në histori. Por gazetarët hulumtues mund të krijojnë baza të të dhënave në një shkallë më të vogël dhe prapë të kenë ndikim të madh. Pra, këtu është një udhëzues hap pas hapi se si t’i qaseni ndërtimit të bazave të të dhënave për hetime.

  1. Bëhuni gati
  • Eksploroni dokumentet nga të cilat do të nxirrni të dhënat. Shihni nëse mund të identifikoni ndonjë model; ato elemente të përsëritura do t’ju japin të dhëna se si të strukturoni bazën e të dhënave tuaja. Nëse po filloni nga e para dhe do të merrni shënime nga intervistat dhe raportimet tradicionale, analizoni raste ose histori të ngjashme për të gjetur gjuhën e përbashkët. Mund të jetë e dobishme të flisni me ekspertë në këtë fazë të eksplorimit.
  • Përcaktoni fushëveprimin e të dhënave që do të grumbulloni. Çfarë periudhe do të mbuloni? Cilat raste do të përfshihen dhe cilat do t’i përjashtoni? (Kjo kërkon kritere të qarta dhe jashtëzakonisht specifike). A do të ketë një kufi në numrin e regjistrimeve që përpunoni? Burimet e projektit tuaj – koha, ekipi, fondet, teknologjia, etj. – do t’ju ndihmojnë t’i përgjigjeni këtyre pyetjeve.
  • Bëni një listë të pyetjeve që dëshironi t’i përgjigjeni gjatë hetimit. Kjo do të udhëheqë hartimin e bazës së të dhënave.
  • Inkurajoni punën në grup, veçanërisht në këtë fazë fillestare. Diskutimet midis kolegëve i bëjnë këto faza të para vendimtare më të lehta dhe punën tuaj më të fortë. Në fakt, kështu filloi projekti Tierra de Resistentes: baza e të dhënave dhe hetimi u formuan gjatë punëtorive të gazetarisë hulumtuese.
  1. Hartimi dhe Zhvillimi i Bazës së të Dhënave
  • Filloni duke përcaktuar se çfarë do të jetë çdo rekord (rresht): raste, persona, vende, produkte, ngjarje, vende, transaksione, etj.
  • Pastaj, bëni një listë të elementeve që do të ndihmonin në identifikimin e secilit regjistrim: këto do të jenë fushat (kolonat) tuaja. Për shembull, nëse çdo rresht është një person, atëherë fushat mund të jenë emri, numri i ID -së, mosha, vendndodhja, profesioni, etj.
  • Përcaktoni një çelës për secilin regjistrim. Numrat identifikues janë një ide më e mirë (kur janë të disponueshme) sesa emrat. Ju gjithashtu mund të shpikni kode duke kombinuar dy ose tre aspekte që e bëjnë secilin rekord unik. Ky çelës do të jetë thelbësor nëse keni nevojë të kryqëzoni mes dy ose më shumë grupe të të dhënave.
  • Përveç fushave identifikuese, përfshini shënime të tjera për detaje – zakonisht paragrafë të shkurtër që do të jenë të dobishëm për tregimin – dhe të tjerë për klasifikim, si ato që i referohen karakteristikave të përbashkëta dhe që përcaktojnë kategori. Për këto fusha të kategorive, është e dobishme të mendoni se çfarë historie mund të dalë nga secila prej tyre. Për shembull, mund të përfshini një kolonë për “garën” për të analizuar nëse ekziston një model racizmi i përfshirë në një grup të dhënash të veçantë.
  • Uniformiteti është parësor. Pra, përdorni konfigurimet e vlefshmërisë për të siguruar që numrat të shtypen si numra, datat janë në formatin e duhur dhe kategoritë të shkruhen gjithmonë në të njëjtën mënyrë. Sa më shumë që të jetë e mundur, bëni shumicën e fushave me shumë përzgjedhje në vend të pyetjeve të hapura.
  • Përfshini fusha për të identifikuar se kush fut secilën pjesë të informacionit dhe cili është burimi origjinal (lidhja me të, gjithashtu). Kjo do të jetë e dobishme më vonë nëse keni nevojë të kontrolloni ndonjë nga të dhënat.
  • Mundohuni të mos e teproni me numrin e fushave. Krijoni vetëm ato që do të jenë të rëndësishme për hetimin tuaj, si dhe për analizën e të dhënave, dhe ato që ekipi juaj do të jetë në gjendje të plotësojë.
  • Baza e të dhënave tuaja mund të ketë nevojë për më shumë se një tabelë, në varësi të kompleksitetit të temës dhe marrëdhënieve midis elementëve të përfshirë.
  • Sigurohuni që dizajni i bazës së të dhënave është miqësore për përdoruesit për të gjithë të përfshirë në projekt, pavarësisht nga niveli i tyre teknologjik. “Duhet të jetë një mjet i ndërtuar veçanërisht për gazetarët dhe me gazetarët,” thotë Paul Radu, bashkëthemelues dhe shef i inovacionit në OCCRP.
  • Bëni bazën e të dhënave të shkallëzueshme: dizajni juaj mund të jetë hapi i parë i një projekti të ardhshëm më të madh, qoftë nga ju dhe ekipi juaj ose dikush tjetër.
  1. Test, Test, Test
  • Kryeni një test pilot të bazës së të dhënave. Plotësoni disa shënime për të parë nëse funksionon ashtu siç e prisni dhe për të vlerësuar nëse do të jetë e dobishme për historitë që shpresoni të punoni. Një mënyrë e mirë për të vlerësuar sa kohë mund të zgjasë projekti: Matni dhe llogaritni kohën mesatare që duhet për të shtuar një rekord të ri, kontroll dhe më pas konfirmoni informacionin.
  • Bëni një listë të “çfarë nëse” për të analizuar pengesat e mundshme ose skenarët e gabimeve dhe përcaktoni se si do t’i kapërceni ato.
  • Vlerësoni besueshmërinë dhe qëndrueshmërinë e fushave më të rëndësishme. Nëse keni burime të ndryshme që thonë gjëra të ndryshme – gjë që është e zakonshme me shifrat ose datat – ju mund të dëshironi ta zhvendosni informacionin në një kolonë detajesh ku mund të përshkruani mosmarrëveshjen në vend që të vendosni arbitrarisht se kush thotë të vërtetën.
  1. Plotësoni bazën e të dhënave
  • Aplikoni atë që mësoni në këtë proces testimi për t’u dhënë trajnime praktike gazetarëve që do të mbledhin, futin dhe analizojnë informacionin në bazën e të dhënave. Sigurohuni që të gjithë i kuptojnë konceptet dhe kategoritë në të njëjtën mënyrë.
  • Përdorni mjetet e ruajtjes bashkëpunuese, në mënyrë që qasja të mos varet vetëm nga një person.
  • Ndani të dhënat duke përdorur kategoritë që keni përcaktuar në fazën e projektimit në mënyrë që rregullat të jenë të qarta se kush mbledh çfarë informacioni dhe si të shmangni dyfishimin.
  • Nëse keni nevojë të grumbulloni të dhëna nga uebi ose nga dokumentet e tekstit, përqendroni përpjekjet tuaja në atë që është më e rëndësishme për hetimin tuaj dhe çfarë do të përcaktojë fokusin e tregimeve tuaja. Në projektin e Trojkës, për shembull, përcaktimi i qëllimit të transaksioneve ishte kyç.
  • Nëse sasia e të dhënave që keni është shumë e madhe për t’u menaxhuar, merrni parasysh të punësoni një profesionist ose kompani të jashtme për të transkriptuar dokumentet në një bazë të dhënash të krijuar më parë me redaksinë tuaj.
  1. Auditimi dhe Kontrollimi i Fakteve
  • Ndërtimi i bazës së të dhënave është vetëm hapi i parë i hetimit. Para se të analizoni të dhënat dhe të nxirrni përfundime, duhet t’i konfirmoni me burimet origjinale, pavarësisht nëse përfshijnë dokumente ose personazhet kryesore të tregimeve. “Ne i çuam të dhënat tona në bashkitë ku ndodhën masakrat në mënyrë që të mbijetuarit të korrigjonin gabimet që mediat dhe njerëzit e tjerë kishin treguar për vite,” shpjegon Parra, për një nga projektet e tij në Rutas del Conflicto.
  • Vendosni se çfarë lloj auditimi do të bëni, i cili do të ndryshojë në varësi të fushëveprimit të projektit tuaj. Ju mund të kontrolloni çdo rekord të vetëm duke i referuar ato me dokumentet origjinale ose mund të bëni kontrolle të rastësishme, por ato duhet të mbulojnë një numër të konsiderueshëm të dhënash në bazën e të dhënave. Në secilin skenar, personi që shqyrton të dhënat nuk duhet të jetë personi që i ka futur ato.
  • Çfarë duhet të kërkoni në auditim? Shtypshkronjat, numrat, datat, kopjimet dhe regjistrimet që nuk i plotësojnë kriteret.
  • Dy ide për rishikimin e numrave: bëni që sistemi të përmbledhë automatikisht totalin dhe t’i krahasojë me ato në dokumentet origjinale, dhe t’i renditni të dhënat për të gjetur largueshmëri (shifra që janë shumë të mëdha ose shumë të vogla dhe mund të jenë një gabim).
  • Baza e të dhënave nuk do të jetë gati për përdorim derisa të ketë kaluar: kontrollimin e fakteve, auditimin e të dhënave, konfrontimet me burimet personale dhe shqyrtimin ligjor.

Softuer

  • Si gazetar, nuk keni nevojë të bëheni zhvillues i sistemeve për të punuar në një projekt të bazës së të dhënave. Në vend të kësaj, përfshini dikë me këtë ekspertizë në ekipin tuaj dhe punoni në partneritet. Kjo listë e mjeteve mund të jetë e dobishme:
  • Aplikacionet për krijimin e një forme uebi që do të ndihmojë reporterët të plotësojnë bazën e të dhënave: Google Forms, Node.js, Django ose Flask.
  • Ruajtja e bazës së të dhënave: MongoDB Atlas ose Firebase e Google.
  • Për strukturimin dhe përpunimin e të dhënave: Python (i cili mund të lidhet me opsionet e ruajtjes të përmendura më lart), PostgreSQL, ELK Stack dhe Filemaker.
  • Për nxjerrjen e të dhënave dhe konvertimin në PDF: Wondershare Pdf Converter Pro, konvertuesi bazë i Dokumenteve Google, iLovePDF, Smallpdf, Tabula, Import.io.
  • Sigurisht, gjithmonë mund të shkarkoni të dhënat nga sistemi i bazës së të dhënave dhe të punoni në të me Excel ose Google Spreadsheets. Fillimi me njërën nga këto mund të jetë gjithashtu opsioni më i mirë për projekte më të vogla.

Rekomandimet dhe Këshillat Përfundimtare

  • Siguria është një çështje kryesore në këto lloje të projekteve, kështu që përdorni komunikime të koduara, kopje rezervë të të dhënave dhe merrni parasysh sigurinë tuaj personale.
  • Mësoni si të përdorni Excel, por gjithashtu bashkëpunoni me shkencëtarët dhe zhvilluesit e të dhënave.
  • Jini të vetëdijshëm për instrumentet që mund ta bëjnë punën më të lehtë: mjetet për skrap, format online për të mbushur bazën e të dhënave, konvertuesit PDF, skanimin me OCR (njohja optike e personazheve) dhe përpunimi masiv i tekstit. Në OCCRP, ata krijuan Aleph, një platformë që i bën pothuajse të gjitha këto detyra; ndihmon me qasje të lehtë, kërkim, transliterim dhe shfletim të vëllimeve të mëdha të regjistrimeve të dokumenteve me shumë format.
  • Meqenëse këto nisma zakonisht kërkojnë ekipe të mëdha, vendosni se kush do të jetë udhëheqësi i projektit dhe merrni parasysh rekomandimet për bashkëpunimet hetimore.
  • Bëni metodologjinë dhe burimet transparente për audiencën tuaj, duke supozuar se protokollet e sigurisë dhe sigurisë e lejojnë atë. Tregoni një mostër të dokumenteve origjinale nga të cilat keni krijuar bazën e të dhënave për të ndërtuar besueshmërinë.
  • Publikoni informacionin tuaj të kontaktit krahas hetimit në mënyrë që lexuesit të mund të kontaktojnë me pyetjet ose nëse shohin një gabim në bazën e të dhënave.
No Comments

Post A Comment