Datu kartogrāfi
Divi filozofi izmanto mašīnmācīšanos un mākslīgo intelektu, lai radītu reāllaika globālās ekonomikas karti, un pasaules lielākās finašu kompānijas jau stājas rindā pie viņu durvīm.
Cik izmaksāja valdības darbības apstāšanās? 35 dienas pēc strupceļa 747 573 federālajiem darbiniekiem kopumā algās netika izmaksāti 6 354 845 148 dolāri. Katra sekunde pieskaitīja vēl 2118 dolāru. Daži tika pakļauti štatu samazināšanai; daudz vairāk bija tādu, kuriem neizmaksāja neko. Piemēram, ASV Iekšzemes drošības departamentā nesamaksāja 245 405 darbiniekiem, bet 32 706 tika piešķirts atvaļinājums. Valsts kases departaments atvaļināja 36 309 un nesamaksāja 82 336 darbiniekiem. Vides aizsardzības aģentūrā 52 % darbinieku strādāja bez kompensācijas.
Postījumu apmēra, kā arī visu tā detaļu novērtēšana nebija viegls uzdevums. Mazpazīstams finanšu tehnoloģiju uzņēmums no Ņujorkas Enigma reāllaikā veidoja visu izmaksu tabulas un publicēja tās mājaslapā ar nosaukumu Government Shutdown 2018-2019.
Lai paveiktu šo uzdevumu, uzņēmumam vajadzēja sameklēt ASV Pārvaldības un budžeta biroja ārkārtas rīcības plānus par 109 federālajiem departamentiem. Izmantojot mājaslapu FederalPlay.org, tika noskaidrotas vidējās algas un darbinieku skaits 46 aģentūrās. Kopumā tika rūpīgi izpētītas 2000 federālo datu dokumentu lapas un divi miljoni tabulu rindu, lai izveidotu informācijas izsekošanas sistēmu. No idejas līdz realizācijai trīs Enigma analītiķiem bija nepieciešamas 36 stundas.
Valdības darbības apstāšanās izmaksu dati ir pieejami bez maksas, taču Enigma spēja zibenīgi savietot vairāku neatkarīgu datu avotu informāciju no publiskiem un privātiem serveriem un izveidot globālās ekonomikas pārskatu ar pielāgojamām attēlošanas iespējām. Tas piesaistīja vairāku pasaules vadošo uzņēmumu, piemēram, BlackRock, PayPal un Celgene, interesi, un tagad daudzi Enigma klienti maksā vairāk nekā miljonu dolāru, lai, pieslēdzoties ar pirkstu nospiedumu, iegūtu pieeju viņu atklāsmēm.
Uzņēmumu Enigma radīja divi labākie draugi Hikams Oudgiri un Marks Dakosta, kuri iepazinās 16 gadu vecumā, studējot filozofiju Kolumbijas Universitātē. Viņu jaunuzņēmums vienā pilnībā savienotā saskarnē organizē informāciju no tūkstošiem avotu visā pasaulē. “Cilvēki zina, kā strādā internets un kā izsekot lietotājus ar sīkfailiem, lai ieteiktu viņiem preces no Amazon. Tā ir atrisināta problēma. Savukārt mēs būvējam reālās pasaules modeli,” sēžot Enigma biroja Humbolta (apgaismības laikmeta Prūsijas filozofs) vārdā nosauktajā sapulču telpā, stāsta 34 gadus vecais Oudigiri. Uzņēmuma līdzdibinātājs Dakosta (34) piebilst: “Tie nav tikai ātrāki mikroprocesori vai labāka statistika. Enigma ir informatīvi grafiki, kas atspoguļo aktuālos procesus ekonomikā.”
Oudigiri un Dakostas ceļš datizraces jomā sākās pēc 2008. gada finanšu krīzes. Dakosta strādāja pie diplomdarba par kultūrantropoloģijas tēmu Kalifornijas Universitātē Ērvinā, bet Oudigiri vadīja atjaunojamās enerģijas projektus BCME bankā Marokā, Kasablankā. Abus saistīja pasaules norišu izprašana globālās recesijas apstākļos. Viņi apvienojās un sāka organizēt publiski pieejamus datus, sākumam izvēloties Federālās aviācijas administrācijas lidojumu žurnālus. Drīz vien viņi atklāja, ka zem brīvi pieejamajiem valdību reģistriem, universitāšu zinātniskajām publikācijām, nekonkrētām uzņēmumu atskaitēm un kravas kuģu manifestiem paslēptas īstas zināšanu dārgumu lādes. Ja šo informāciju izdodotos savākt, izpētīt, sakārtot un izanalizēt, viņuprāt, varētu radīt makroekonomikas pārskatu reāllaikā.
2011. gadā Oudigiri un Dakosta izveidoja Enigma un sāka apkopot publiski pieejamos datus, lielākoties no valdības avotiem, piemēraam, Uzskaites biroja (Census Bureau), Federālās sakaru komisijas (FCC), Federālo vēlēšanu komisijas un Ieņēmumu dienesta (IRS), kā arī ASV Muitas un robežsardzes aģentūras importa datubāzes un būvatļauju žurnāla, apvienojot visu vienā kopējā avotā. Tādējādi viņi kļuvas arī par sarežģītas un grūti atrodamas informācijas atklāšanas ekspertiem. Teiksim, izmantojot pieprasījumus atbilstoši Informācijas brīvības aktam, Enigma pieslēdzas robežapsardzības biroja (CBP) automatizētajai sistēmai, lai izsekotu katru konteinerkuģi, kas ierodas ASV gan kā importa ostā, gan kā piestāšanas ostā. Savukārt no Nacionālās ugunsnelaimju apziņošanas sistēmas Enigma izgūst cēloņa un atrašanās vietas datus par katru ugunsgrēku ASV. Informācijas iegūšanai par enerģētikas jomu Enigma paļaujas uz naftas urbumu datiem no Teksasas dzelzceļa komisijas, kas tika nodibināta 1891. gadā ar mērķi noteikt tarifus.
Pirmos lielos panākumus viņi sagaidīja 2014. gadā, kad Enigma ieguva 4,5 miljonu dolāru finansējumu no Comcast, American Express un The New York Timer Co. un iekļuva Fintech Innovation Lab inkubatorā, ko izveidojusi kompānija Accenture sadarbībā ar Ņujorkas Partnerības fondu. Ieguvuši piekļuvi banku un Volstrītas gigantu datiem, Oudigiri un Dakosta atklāja, ka tiem ir ārkārtīgi plašas pielietojuma iespējas finanšu pakalpojumu jomā. Savienojot informāciju ar banku sistēmu klientu reģistriem, varēja ātri atklāt krāpšanas mēģinājumus, kā arī noskaidrot atbildīgos uzņēmumus un privātpersonas. “Mēs izgājām ar kaujas plānu,” par biznesa inkubatoru stāsta Dakosta. Drīz vien viņi izveidoja programmnodrošinājuma paketi, kas bija pilna ar krāsainiem grafikiem, un integrēja atbilstības pārbaužu saskarnēs specializētus rīkus, sauktus par Dossier (dosjē).
Līdz šim uzņēmums Enigma ir sintezējis 100 000 datu kopu vairāk nekā 100 valstīs, organizējuši informāciju no vairāk nekā 30 miljoniem mazo uzņēmumu, un uzkrājis 140 miljardus datu vienumu par ASV iedzīvotājiem. Ir izpētīta katra molekula ASV farmācijas nozarē, kā arī visa informācija par zāļu testiem, patentu pieteikumiem un blakusparādībām.
Enigma galveno mītni Ņujorkā, Flatiron apkaimē, caurstrāvo gudrība. Sapulču telpas ir nosauktas filozofu vārdā, kā Mišels de Monteņs un Augustīns. Grāmatu plauktos līdzās kodēšanas pamācībām gozējas akadēmiķu darbi – grāmatas Mašīnmācīšanās hakeriem un Datu kvalitātes un ierakstu sasaistes tehnikas stāv vāku pie vāka ar Platona Dialogiem, Džeimsa Džoisa Ulisu un Ruso Atzīšanos. Sienas rotā kartes un eksperimentāli mākslas darbi, kuros atainota “datu mijiedarbība ar pieredzi.”
Tomēr Enigma nūģīgā akadēmiskā kultūra nav aizbaidījusi Silīcija ielejas un Volstrītas fondu investīcijas. BlackRock, Paypal, American Express, MetLife, BB&T, Celgene, Merck un EMD Millipore... visi ir iesaistījušiem. No riska kapitāla ieguldītājiem NEA, Crosslink Capital un Glynn Capital, kā arī hedžfondiem Two Sigma Ventures un Third Point Ventures uzņēmumā pēdējo septiņu gadu laikā ieplūduši 130 miljoni dolāru. Forbes novērtē Enigma par 750 miljoniem dolāru ar ikgadējiem ieņēmumiem gandrīz 30 miljonu apmērā un divreiz lielāku klientu bāzi, salīdzinot ar 2018. gadu.
Ja riska ieguldījumu fondi vēlas zināt, kura restorānu ķēde aug visātrāk, Enigma var pārbaudīt Federālās sakaru komisijas radio licenču datus; tās ēdinātājiem nepieciešamas, lai varētu atvērt ēdienu līdzņemšanas logus. Apdrošinātāji izmanto Enigma risku novērtēšanai, bet farmakoloģijas kompānijas pēta datu analīzes iekārtas, lai uzlabotu savu zāļu drošību.
Līdz šim uzņēmums Enigma ir sintezējis 100 000 datu kopu vairāk nekā 100 valstīs, organizējuši informāciju no vairāk nekā 30 miljoniem mazo uzņēmumu, un uzkrājis 140 miljardus datu vienumu par ASV iedzīvotājiem. Ir izpētīta katra molekula ASV farmācijas nozarē, kā arī visa informācija par zāļu testiem, patentu pieteikumiem un blakusparādībām.
Vēlaties ātri un precīzi noteikt labākos kandidātus mazo uzņēmumu aizņēmumiem? Tā vietā, lai veiktu aukstos zvanus uz administrācijas tālruņiem vai izprašņātu Komercreģistra ierēdņus, Enigma sintezē nekustamā īpašuma nodokļa deklarāciju informāciju ar valsts uzņēmumu pārskatiem un Vienotās tirdzniecības kodeksa apgrūtinājumu datiem, lai izveidotu automatizētu kredītreitingu. Nevēlaties apdrošināt paaugstinātam ugunsgrēka riskam pakļautus īpašumus? Kāpēc gan nesasaistīt kopā zvanu reģistrus avārijas dienestiem ar būvatļaujām?
MetLife digitālizācijas stratēģijas vadītājs Gregs Baksters izmanto Enigma iegūtos datus no sabiedrības veselības organizāciju sistēmām un universitātēm, savienojot tos ar savām sistēmām, lai noteiktu slimību riskam pakļautus reģionus, tādējādi uzlabojot risku parakstīšanas metodes. Un ar MetLife 588 miljardu dolāru investīciju portfeli Baksters izmanto Enigma datus, lai noteiktu, kā restorānu, parku un sabiedrisko pasākumu norises vietu kvalitāte ietekmē nekustamā īpašuma cenas. “Viņi atklāj datu avotus, organizē datus, un tad viņi atrod veidus, kā šos datus savienot, izmantojot mašīnmācīšanos,” saka Baksters. “Apvienojot ārējos datus ar mūsu iekšējā domēna datiem, jūs varat iegūt fenomenāli labas tendenču prognozes.”
Investors Džons Fogelsongs no Glynn Capital domā, ka šis jaunuzņēmums varētu kļūt par draudu tādiem attīstītiem slēgto sistēmu big box tehnoloģiju izplatītājiem kā Oracle, IBM, SAS un SAP: “Katrs jauns Enigma datu kopums nodrošina rīkus, ar kuru palīdzību uzņēmums var uzlabot savus klientu pārvaldības procesus.”
Visai uzskatāma ir BlackRock nesenā pieredze. Kad jaunajam mārketinga nodaļas vadītājam Frenkam Kūperam lūdza atsvaidzināt sešu triljonu dolāru aktīvu uzņēmuma klientu piesaistes procesu, Enigma nāca klajā ar pārsteidzošu atklājumu – pretēji tradicionālajai pieejai, kas balstīta uz reģionālo vai demogrāfisko atlasi, starp klienta atrašanās vietu un viņa gatavību pensijas vecumam bija maza korelācija, bet noteicošā bija politiskā līdzdalība. “Ja kāds ir politiski aktīvs, un pat tad, ja šis cilvēks vēl aizvien dzīvo īrētā īpašumā, pastāv daudz lielāka iespēja, ka viņus interesē pensijas plānošana,” saka Kūpers. “Mums tas bija pārsteigums.”
Ne visi Enigma mašīnmācīšanās algoritmi tiek apmācīti ar mērķi gūt peļņu. Uzņēmums brīvprātīgi piedalījies datu ieguvē un izpētē par dzimumu nevienlīdzību 558 profesijās un jau identificējis, ka viskrasākās atšķirības vērojamas grāmatvedībā, mazumtirdzniecībā un pārdošanā.
Pēc tam, kad 2014. gada novembrī Ņuorleānā ugunsnelaimē mājā bez dūmu detektoriem dzīvību zaudēja pieci cilvēki, Enigma sadarbībā ar pilsētas ugunsdzēsības departamentu un citiem dienestiem identificēja apkaimes, kurās ir vājākā ugunsdrošība. Enigma publiski pieejamajā mājaslapā pilsētplānotājiem bez maksas pieejami dati par ugunsnelaimēm valstī un laikapstākļu anomālijām 50 gadu periodā ASV, kā arī datu kopas par visu ar vēzi saistīto statistiku – līdz pat Pārtikas un zāļu administrācijas definētajām medikamentu blakusparādībām. Piemēram Ņujorkā Enigma atbilstoši Informācijas brīvības aktam ir atļauts sintezēt daudzu gadu datus par negadījumiem un traumām, par ko ziņots metropoles transporta dienestiem. Uzņēmums strādā arī pie bezpeļņas nodibinājuma Polaris, kas cīnās pret verdzību un cilvēktirdzniecību. Ideja ir tāda, ka dati var palīdzēt ne tikai apdrošinātājiem, bet arī valdībām. Oudigiri un Dakosta sauc to par “sociāli atbildīgiem datiem.”
Vai Enigma ir pakļauts datu izmantošanas skandālu riskam – līdzīgi kā Facebook? “Es domāju, ka interneta kompāniju uzvedība ir bijusi aizdomīga, varbūt pat prettiesiska, ieviešot tik smalku jūsu uzvedības izpētes atveidi, kādai jūs nekad nepiekristu,” saka Oudigiri, uzsverot, ka Enigma darbs ar finanšu pakalpojumu sniedzējiem ir balstīts uz savstarpēji izdevīgākiem nosacījumiem. “Dati par jums ir veids, kā saprast, vai esat īsts cilvēks. No privātuma viedokļa jūs šīs attiecības uzsākat apzināti un nepārprotami. Nepieciešamība dalīties ar datiem rodas kādā interesantākā vietā.”