MCA-PRESS | Si inteligjenca Artificiale mund të na ndihmojë të publikojmë më shumë histori të Panama Papers
720
post-template-default,single,single-post,postid-720,single-format-standard,ajax_fade,page_not_loaded,,qode-title-hidden,qode_grid_1300,hide_top_bar_on_mobile_header,qode-content-sidebar-responsive,qode-theme-ver-16.6,qode-theme-bridge,disabled_footer_bottom,wpb-js-composer js-comp-ver-5.5.1,vc_responsive,elementor-default,elementor-kit-2266

Si inteligjenca Artificiale mund të na ndihmojë të publikojmë më shumë histori të Panama Papers

Një partneritet i ri midis gazetarëve dhe shkencëtarëve të inteligjencës artificiale synon të përmirësojë procesin e raportimit hulumtues. Ja çfarë mësuam deri më tani.

Rrjedhja gjigande financiare që rrëzoi dy qeveri dhe zbuloi vrimën e zezë më të madhe deri më tani për fshehtësinë e parajsës fiskale, unë shpesh pyes veten se çfarë historish kemi humbur. Panama Papers ofruan një shembull frymëzues të bashkëpunimit mediatik përtej kufijve dhe përdorimit të teknologjisë me burim të hapur në shërbim të raportimit. Siç tha një nga kolegët e mi: “Ju në thelb keni pasur një sasi të madhe dhe të çrregullt të të dhënave në duart tuaja dhe keni përdorur teknologjinë për të përhapur problemin tuaj – për ta bërë atë problemin e të gjithëve.” Ai po iu referohej 400 gazetarëve, përfshirë edhe veten e tij, të cilët për më shumë se një vit punuan së bashku në një redaksi virtuale për të zbuluar misteret e fshehura në një mori dokumentesh nga firma ligjore panameze Mossack Fonseca. Ata reporterë përdorën teknologjinë e burimit të të dhënave me burim të hapur dhe bazat e të dhënave të grafikëve për të luftuar me 11.5 milion dokumente në dhjetra formate të ndryshme në tokë. Akoma, ata që bënin pjesën më të madhe të të menduarit në atë ekuacion ishin gazetarët. Teknologjia na ndihmoi të organizojmë, indeksojmë, filtrojmë dhe t’i bëjmë të dhënat të kërkueshme. Gjithçka tjetër erdhi në atë që ata 400 truri dinin dhe kuptonin së bashku për personazhet dhe skemat, burrat e kashtës, kompanitë e para dhe bankat që ishin të përfshirë në botën e fshehtë në det të hapur. Nëse e mendoni, ai ishte ende një proces shumë manual dhe kohë. Gazetarët duhet të shtypnin kërkimet e tyre një nga një në një platformë të ngjashme me Google bazuar në ato që dinin.

Po për ato që nuk dinin?

Kaloni përpara tre vjet në botën e lulëzuar të algoritmeve të të mësuarit makinerik që po ndryshojnë mënyrën e punës së njerëzve, nga bujqësia te mjekësia te biznesi i luftës. Kompjuterët mësojnë atë që dimë dhe më pas na ndihmojnë të gjejmë modele të paparashikuara dhe të parashikojmë ngjarje në mënyra që do të ishte e pamundur për ne t’i bënim vetë.

Si do të dukej kërkimi ynë nëse do të vendosnim algoritme të të mësuarit makiner në Panama Papers? A mund t’i mësojmë kompjuterët të njohin pastrimin e parave? A mundet që një algoritëm të diferencojë një hua të ligjshme nga një e rremë e krijuar për të ndërruar para midis njësive? A mund ta përdorim njohjen e fytyrës për të përcaktuar më lehtë se cilat prej mijëra kopjeve të pasaportave në troje u përkasin politikanëve të zgjedhur ose kriminelëve të njohur?

Përgjigja për të gjitha këto është po. Pyetja më e madhe është se si mund t’i demokratizojmë ato teknologji AI, të kontrolluara sot kryesisht nga Google, Facebook, IBM dhe një pjesë e kompanive dhe qeverive të tjera të mëdha, dhe t’i integrojmë plotësisht ato në procesin e raportimit hetimor në redaksitë e të gjitha madhësive?

Një mënyrë është përmes partneritetit me universitetet. Unë erdha në Stanford vjeshtën e kaluar në një Bursë të Gazetarisë John S. Knight për të studiuar se si inteligjenca artificiale mund të përmirësojë raportimin hulumtues në mënyrë që të zbulojmë keqbërje dhe korrupsion në mënyrë më efikase.

Demokratizimi i Inteligjencës Artificiale

Kërkimi im më çoi në Laboratorin e Inteligjencës Artificiale të Stanfordit dhe më saktësisht në laboratorin e Prof. Chris Ré, një marrës i gjeniut gjeni MacArthur, ekipi i të cilit ka prodhuar kërkime të fundit mbi një nëngrup të teknikave të të mësuarit të makinës të quajtur “mbikëqyrje e dobët”. Qëllimi i laboratorit është që “ta bëjë më të shpejtë dhe më të lehtë të injektojë atë që një njeri di për botën në një model të të mësuarit makinerik”, shpjegon Alex Ratner, një Ph.D. student i cili udhëheq projektin e mbikëqyrjes së dobët të laboratorit me burim të hapur, të quajtur Snorkel. Qasja mbizotëruese e të mësuarit makinerik sot është mësimi i mbikëqyrur, në të cilin njerëzit kalojnë muaj ose vite duke etiketuar miliona pika të të dhënave individualisht në mënyrë që kompjuterët të mësojnë të parashikojnë ngjarjet. Për shembull, për të trajnuar një model të të mësuarit në makinë për të parashikuar nëse një rreze X në gjoks është jonormale apo jo, një radiolog mund të etiketojë me dorë dhjetëra mijëra radiografi si “normale” ose “jonormale”. Qëllimi i Snorkel, dhe teknikat e dobëta të mbikëqyrjes më gjerë, është që të lejojë experts ekspertët e fushës ’(në rastin tonë, gazetarët) të stërvitin modele të të mësuarit të makinës duke përdorur funksione ose rregulla që etiketojnë automatikisht të dhënat në vend të procesit të lodhshëm dhe të kushtueshëm të etiketimit me dorë. Diçka përgjatë vijave të: “Nëse hasni problemin x, trajtojeni në këtë mënyrë.” (Këtu është një përshkrim teknik i Snorkel).

“Ne synojmë të demokratizojmë dhe përshpejtojmë të mësuarit makinerik,” tha Ratner kur u takuam për herë të parë vjeshtën e kaluar, gjë që menjëherë më bëri të mendoj për aplikimet e mundshme për raportimin hulumtues. Nëse Snorkel mund të ndihmojë mjekët të nxjerrin shpejt njohuritë nga rrezet x dhe skanimet CT për të bërë pacientët e triazhit në një mënyrë që ka kuptim – në vend që pacientët të lëngojnë në radhë – kjo mund të ndihmojë gjithashtu gazetarët të gjejnë plumba dhe t’i japin përparësi historive në Panama Papers situatat.

Gazetarët e ICIJ dhe shkencëtarët kërkues të Universitetit Stanford përdorin inteligjencën artificiale në një hetim gazetaresk.

Ratner gjithashtu më tha se ai nuk ishte i interesuar për zgjidhje “të panevojshme”. Ai synon mënyrën më të shpejtë dhe të thjeshtë për të zgjidhur çdo problem.

Në fillim të janarit, dhoma ime e lajmeve, Konsorciumi Ndërkombëtar i Gazetarëve Investigativë (ICIJ) dhe laboratori i Re’s Stanford filluan një bashkëpunim që kërkon të përmirësojë procesin e raportimit hulumtues. Për të respektuar parimin “asgjë pa nevojë”, ne e quajmë atë Inteligjencë Artificiale për Hetimet.

Për gazetarët, thirrja për të bashkëpunuar me akademikë është e dyfishtë: qasja në mjete dhe teknika që mund të ndihmojnë raportimin tonë, dhe mungesa e qëllimit tregtar në mjedisin e universitetit. Për akademikët, thirrja është problemi dhe grupi i të dhënave “bota reale” që gazetarët sjellin në tryezë dhe, potencialisht, sfida të reja teknike. Këtu janë mësimet që kemi mësuar deri më tani në partneritetin tonë:

Laboratori i Chris Ré, për shembull, është pjesë e një konsorciumi të qeverisë dhe organizatave të sektorit privat që zhvilluan një sërë mjetesh të dizajnuara për të “ndezur” Rrjetin e Errët. Duke përdorur të mësuarit makinerik, agjencitë e zbatimit të ligjit ishin në gjendje të nxirrnin dhe vizualizonin informacione – ndonjëherë të fshehura brenda imazheve – që i ndihmuan ata të ndiqnin rrjetet e trafikimit njerëzor që lulëzojnë në internet. Kërkimi i Panama Papers nuk është aq i ndryshëm nga kërkimi në thellësitë e Rrjetit të Errët. Ne kemi shumë për të mësuar nga puna e mëparshme e laboratorit.

Sigurohuni që të ketë stimuj nga të dy palët.

Ka shumë shkencëtarë të inteligjencës me mendje qytetare të shqetësuar për gjendjen e demokracisë të cilët dëshirojnë të ndihmojnë gazetarët të bëjnë raportim në ndryshimin e botës. Por që një partneritet të zgjasë dhe të jetë produktiv, ndihmon nëse ekziston një sfidë teknike që akademikët mund të trajtojnë dhe nëse të dhënat mund të riprodhohen dhe publikohen në një mjedis akademik. Renditeni në fillim të marrëdhënies nëse ka një shtrirje të qëllimit dhe cilat janë shkëmbimet. Për ne, do të thoshte të përqendroheshim së pari në një hetim mjekësor të të dhënave publike, sepse përshtatet mirë me hulumtimet që laboratori i Ré tashmë po bënte për të ndihmuar mjekët të parashikojnë se kur një pajisje mjekësore mund të dështojë. Partneriteti po na ndihmon të ndërtojmë mbi punën e të mësuarit makinerik që ekipi i ICIJ bëri vitin e kaluar për hetimin e vlerësuar me çmime Implant Files, i cili ekspozoi mungesën e madhe të rregullimit të pajisjeve mjekësore në të gjithë botën.

Zgjidhni të dobishme, jo të zbukuruar.

Ka probleme për të cilat nuk kemi nevojë fare për të mësuar makinerinë. Pra, si ta dimë kur AI është zgjedhja e duhur? John Keefe, i cili drejton Quartz AI Studio, thotë se të mësuarit makinerik mund të ndihmojë gazetarët në situata ku ata e dinë se çfarë informacioni kërkojnë në sasi të mëdha të dokumenteve, por gjetja e tyre do të zgjaste shumë ose do të ishte shumë e vështirë. Merrni shembujt e hetimit të avionëve spiunë të Buzzfeed News ‘2017 në të cilin një algoritëm i të mësuarit të makinës ishte vendosur në të dhënat e gjurmimit të fluturimit për të identifikuar avionët e mbikëqyrjes (këtu kompjuteri ishte mësuar me ritmet e kthimit, modelet e shpejtësisë dhe lartësisë së avionëve spiunë), ose Hetimi Kushtetues i Atlanta Journal mbi ngacmimet seksuale të mjekëve, në të cilin një algoritëm kompjuterik ndihmoi në identifikimin e rasteve të abuzimit seksual në më shumë se 100,000 dokumente disiplinore. Unë jam gjithashtu i hipnotizuar nga puna e agjencisë ukrainase të gazetarisë së të dhënave Texty, e cila përdori mësimin e makinës për të zbuluar vendet e paligjshme të minierave të qelibarit përmes analizës së 450,000 imazheve satelitore.

‘Reporteri në lak’ gjatë gjithë rrugës.

Nëse jeni duke përdorur të mësuarin me makinë në hetimin tuaj, sigurohuni që të blini nga reporterët dhe redaktorët e përfshirë në projekt. Mund të gjeni rezistencë sepse shkrim-leximi i AI në redaksi është ende mjaft i ulët. Në ICIJ, redaktuesja e hulumtimit Emilia Diaz-Struck ka qenë “Përkthyesi i AI” për redaksinë tonë, duke ndihmuar gazetarët të kuptojnë pse dhe kur mund të zgjedhim të përdorim mësimin makinerik. “Përfundimi është që ne e përdorim atë për të zgjidhur problemet gazetareske që përndryshe nuk do të zgjidheshin,” thotë ajo. Gazetarët luajnë një rol të madh në procesin e AI sepse ata janë experts ekspertët e domenit ’që kompjuteri duhet të mësojë – ekuivalente me radiologun i cili stërvit një model për të njohur nivele të ndryshme të malignitetit në një tumor. Në hetimin e Implant Files, reporterët ndihmuan në trajnimin e një algoritmi për të mësuar makinerinë për të identifikuar sistematikisht raportet e vdekjeve që ishin klasifikuar keq si lëndime dhe keqfunksionime, një trend i parë i parë nga një burim i cili informoi gazetarët.

Nuk është magji!

Kompjuteri po rrit punën e një gazetari duke mos e zëvendësuar atë. Ekipi i AJC lexoi të gjitha dokumentet që lidhen me më shumë se 6,000 raste të abuzimit seksual të mjekëve që gjeti duke përdorur të mësuarit makinerik. Kontrolluesit e fakteve të ICIJ shqyrtuan manualisht secilën prej 2,100 vdekjeve që zbuloi algoritmi. “Gazetaria nuk ndalet, thjesht merr një kërcim”, thotë Keefe. Ekipi i tij në Quartz kohët e fundit mori një grant nga Fondacioni Knight për të bashkëpunuar me redaksitë në hetimet e të mësuarit makinerik. Ndani përvojën në mënyrë që të tjerët të mësojnë. Në këtë fushë, gazetarët kanë shumë për të mësuar nga tradita akademike e ndërtimit të njohurive të njëri-tjetrit dhe ndarjes së hapur të rezultateve, të mira dhe të këqija. “Dështimi është një sinjal i rëndësishëm për studiuesit”, thotë Ratner. “Kur punojmë për një projekt që dështon, sa i turpshëm është, kjo është shpesh ajo që fillon projekte shumëvjeçare kërkimore. Në këto bashkëpunime, dështimi është diçka që duhet gjurmuar, matur dhe raportuar. ”

Pra, po, do të dëgjoni nga të dyja anët!

Ekziston një ton i qetësisë që mund të ndodhë kur dy botë të ndryshme bashkohen për të trajtuar një problem. Ekipi i të dhënave të ICIJ tani ka filluar të bashkëpunojë me një pjesë tjetër të laboratorit të Ré që specializohet në nxjerrjen e kuptimit dhe marrëdhënieve nga teksti që është “bllokuar” në tabela dhe formate të tjera të çuditshme (mendoni dokumentet e SEC ose grafikët kryesorë të projektit nga ICIJ’s Luxembourg Leaks). Laboratori po punon gjithashtu për aplikime të tjera më futuriste, të tilla si kapja e shpjegimeve të gjuhës natyrore nga ekspertët e domain-it që mund të përdoren për të trajnuar modelet e AI (quhet në mënyrë të përshtatshme Babble Labble) ose gjurmimi i syve të radiologëve kur lexojnë një studim për të parë nëse ato sinjale gjithashtu mund të ndihmojë në trajnimin e algoritmeve. Ndoshta një ditë, jo shumë larg në të ardhmen, kolegu im i ICIJ Will Fitzgibbon do të përdorë Babble Labble për të folur me kujdes kompjuterin për njohuritë e tij për pastrimin e parave. Dhe ne do të gjurmojmë sytë e kolegut tim Simon Bowers kur ai interpreton ato grafikë të pamundur, me shumë hapa që, kur zhbllokohen, zbulojnë skemat që përdorin kompanitë shumëkombëshe për të shmangur pagimin e taksave.

Ndërkohë, ne qëndrojmë të vërtetë.

Marina Walker Guevara, ICIJ

No Comments

Post A Comment