@ RESTART // 2018.10.13
geenius_restart_0797.mp3
KUUPÄEV
2018-10-13
PIKKUS
40m 15s
SAADE
RESTART
AI_KOKKUVÕTE
Saates arutletakse avaandmete olemuse ja nende kasutamise võimaluste üle Eestis. Külalised selgitavad, kuidas riigi hallatavate andmete avalikustamine masinloetaval kujul aitaks kaasa ühiskondlikule innovatsioonile, efektiivsemale juhtimisele ja uute teenuste loomisele.
KÜLALISED
SAATEJUHID
TEEMAD
ORIGINAALKIRJELDUS
Restardis räägime avaandmetest. Mis need on, miks neid Eestis peaks vaja kasutada olema ja kuidas nad meie elu paremaks teeksid? Stuudios on Maarja Leena Saar Open Knowledge Estoniast ning Ott Velsberg majandus- ja kommunikatsiooniministeeriumist. Saatejuht Henrik Roonemaa uudisteportaalist Geenius.ee .
Kuku Raadios välja öeldud seisukohad ei pea ühtima Kuku Raadio seisukohtadega. Te kuulate Kuku Raadiot. Restart. Saadet toetab Telia, nutikate IT-lahenduste pakkuja Eestis.
Tere tulemast Restardi saadet kuulama kõigile, kes on raadiote ees või kõrvaklapid endale pähe pannud, Restart on eetrisse, nagu ikka. Saatejuht Henrik Roonemaa uudisteportaalist geenius.ee ja täna on meil kaks külalist, meil on külas Maarja-Lena Saar, Open Knowledge Estonia projektijuht,
tere. Tere.
Ja Ott Velsberg, kes on Majandusministeeriumis chief data officer'i nimelise tiitliga, tere. Tervist. Me peaks, hakkame, Maarja-Lena, sinust peale, mis asi on Open Knowledge Estonia?
Open Knowledge Estonia on MTÜ, ehk siis huvikaitseorganisatsioon ja üks suur valdkond, millega me tegeleme, ongi avaandmed. Ja projektijuht olen ma siis selles projektis, mis, mis algas juba selle aasta alguses ja kus me oleme strateegilises partnerluses MKM-iga. Ja aitame järgmise kolme aasta jooksul siis avaandmete teemat Eestis edasi.
No kelle kokku pandud MTÜ see on, kelle, kelle kõrvats seal taga on?
Kelle kõrvad, seal alustajate seas on olemas Hille Insberg, Tanel Mällo, Märt Põder ja siis mina ise Maarja Leena.
Nii et selles mõttes, kas ta kuidagi nagu riigiga seotud või ongi pigem selline mure, murelike kodanike liikumine?
No tegelikult on avaandmetel olnud Eestis ju mitu lainet, et Open Knowledge Estonias sündiski siis nüüd uue kogukonna tõusuga kuskil kaks aastat tagasi. Nii et meil on väga hea meel, et me nüüd oleme ka niimoodi professionaliseerumas, et teeme ka reaalset tööd ja meil on tellimus riigil. Nii et
iga päev keegi tegeleb selle küsimusega, okei. Ott, Eestis ei ole riigisektoris ingliskeelseid ametinimetusi, et CDO, chief data officer, samas on noh, Läänest täiesti tuntud nagu CTO või CO, eks ole, mis, millega sa tegeled iga päev seal ministeeriumis?
Mul üldiselt on siis kolm valdkonda, et andmohaldusega laiemalt. Siis ühe osana on veel lisaks avandmed ning ka andmeanalüütika ja siis sinna juurde ka tehisintellekti rakendustega siis ja selle edendamisega. Ma
saan aru, et Eesti ja selline IT tulevik on päris palju sinu peas kinni.
Jah, et üldiselt me proovime koordineerida, koordineerida seda liigi tasemel. Ja panna paika oma seda visiooni.
No meil tänane saade on üsna A ja B saade, selles mõttes, et kui meie inimene, kes meid kuulab, on suur avaandmete spetsialist, siis noh, võib-olla, et. Et teil just väga palju siin kuulata ei ole, aga ma arvan, et enamus inimesi ei ole. Et noh, nagu sa ütlesid, Mare Leena, et need avaandmete juttu, no mina ka mäletan ammusest ajast, et seda on räägitud ja räägitud ja räägitud. Aga lõpuni ma arvan ikkagi päris keegi pole aru saanud, et mis asi see siis on ja kuidas seda nagu tegema peaks ja mis sellest kõigest kasu on. Et hakkame algusest peale, defineerige ära, mis asjad on avaandmed?
Avaandmed on siis riigi poolt kogutud andmed, mida siis riik teeks avalikuks. Ja see on, ma arvan, selline lihtne definitsioon sellele. Et mõte on see, et neid andmeid saaks kasutada vabalt, need on vaba juurdepääsuga, litsents on antud. Ja kodanikel või siis ettevõtetel on võimalik neid andmeid kasutada endal rakendustel loomiseks, visualiseerimiseks ja nii edasi.
No kui ma mõtlen riigi andmete peale, eks ole, et siis esimesena noh, tulevad ikka ju meelde need asjad, millega sa kokku puutud, et noh, et riigil on andmed selle kohta, palju kõigi makse maksab ja kes siin üldse elab ja ma ei tea. Mis majad meil siin on ja igasugused, kas sa mõtled neid andmeid või, või midagi muud?
Need, esiteks, need ei tohiks olla isiksustatud, et sealtpoolt tulevad paljud maksuandmed ära. Aga kui me räägime näiteks, mis on praegu populaarsed, siis on PPA näiteks kuritegude statistika. On näha siis kus kohas, mis kuriteod on toimunud ja selle peale on viimased nüüd paar nädalat on päris palju rakendusi ehitatud. Ja ühe näitena, et praegult on pooleli sellises piloodifaasis, kus võetakse samamoodi kriminaalstatistika ja ehitatakse sellist nii-öelda elukoha heaoluindeksit, proovitakse selle andmete pealt teha. Et see on see üks näide.
No kui me mõtlema hakkame, siis tõenäoliselt riigil on väga, väga, väga, väga palju andmeid või? Jah. Lõpetades sellega, et ma ei tea, mis meie välisõhu kvaliteet siin, siin Ahtri tänaval on, eks. Et ja need on siis tänapäeval kuskil lihtsalt iga asutuse mingisuguses andmebaasikeses, jah.
Nüüd ma tahaksin ja just juurde kommenteerida, et kui meie räägime siin avaandmetest Eesti kontekstis, siis me mõtleme seda ikkagistki masinnõistetaval kujul olevaid avaandmeid. Et meil on hästi palju avalikke andmeid, aga see ei ole päris see, mida me mõtleme avaandmete all, kuigi väliskirjanduses võib ka seda mõelda, nii et siin on ka üsna palju segadust, sihukest. Inimest ei ole olemas, kes on täielik avaandmete ekspert, et siin on nii palju erinevaid osasid, on olemas see tehniline osa ja siis ka see protsessiline osa, kogu see ökosüsteem, mis peaks siis neid andmeid kuidagi kasutama ja tegema arusaadavaks ka siis raadiokuulajale. Nemad ju ei näe neid numbreid ja, ja programmijuppe seal taga, et nad näevad ikkagi tõenäoliselt mingisugust visuaali, mis anna, aitab neil kuidagi asjadest paremini aru saada või targemaid otsuseid teha.
Aga kokkuvõte on see, et riigil on meeletus koguses igasugu andmeid olemas ja, ja, ja harjumuspäraselt, ma arvan, on ju. Tavaliselt on nii-öelda, et neid hoitakse siis nagu endale või et noh, kui ma olen riigiasutus X ja ma ei tea, mul ongi mingi peenosakeste andmebaas, õhus olevate peenosakeste andmebaas. Siis ma ei ole kunagi mõelnud selle peale, et kas ma peaksin seda terve rahvaga jagama. Täpselt.
No meil praegu on olemas selline asi nagu teabenõuete esitamise võimalus ja, ja kui seda teha, siis seda tõenäoliselt saab, nii et selles mõttes on andmed ligipääsetavad läbi e-kirja ja, ja siis konkreetse suhtluse. Aga meie töö ongi nagu see, et me teeme seda lihtsamaks, et need andmed oleks juba kohe väljas, et neid teabenõudeid peaks eraldi esitama, vaid see vajalik teave oleks juba kohe kättesaadav.
Et ta oleks siis mingi standardiseeritud kujul, et arvuti läheb, vaatab, saab aru.
Jah, jah, see oleks ideaal.
Miks see hea on, miks me peame sellele oma aega kulutama?
No esiteks, juba Maarja Leena mainis ka, et teabenõud, et ma räägin siis nii-öelda riigi poole pealt, me suudame tegelikult vähendada halduskoormust sellega. Teiseks on ettevõtluse areng ja ühiskonnale lisandväärtuste loomine. Et kui me vaatame näiteks New Yorgi linna, siis seal avaandmete põhjal tegelikult on võimalik, praegult juba tehakse seda, siis masinõppe komponent juures, kaardistada ära teelõigud, kus on problemaatilised teelõigud.
Kus on auk või?
Mitte augud, aga ka näiteks, kus liiklusvoog jääb seisma, kus tekivad ummikud. Ja selle andmete pealt saab tegelikult teha paremini investeeringuid. Et kus peaks järgmised ehitusprojektid olema, kuidas planeerida siis liiklusvoogusid, et see on näiteks üks näide. Teine on Chicago linnas. Kus samamoodi avaandmete põhjal tegelikult leitakse ülesse restoranid, kus võid olla probleeme hügieeninõuete jälgimisega.
Kuidas, kuidas seda leitakse avaandmete pealt?
Seal on, esiteks nad võtavad seal kokku õhutemperatuuri, siis eelnevad läbiviidud, siis hügieenilinevõtte sellised, ma ei tea, jälgimised, protseduurid ja kõik see pannakse kokku. Ja seal ongi leitud, et näiteks õhutemperatuur, siis rottide olemasolu, siis kui sul on eelnevalt olnud probleeme, siis see annab kõik kokku sellise suurema tõenäosuse, et seal näiteks võib-olla uuesti midagi. Ja see täpsus oli seal äkki mingi kaheksakümmend protsenti, mis nad suudavad palju täpsemalt saata siis endal ametnikke kontrollima.
See on päris, päris võimas, et kui meil Eestis ka nii oleks, siis, siis te väidate, et me elu siin riigis oleks parem. Kui meil oleks, kõik asutused teeksid avaandmeid, et siis läheks elu paremaks.
No kindlasti meil avaneksid mingisugused võimalused, mida me praegu ei näe ja see halduskoormuse kahanemine võib-olla ei tundu nii ilmselge, sest me oleme üsna toores faasis, et. Loomulikult kõiki neid analüüse ju tehakse asutuste sees juba praegu, ka täna, aga. Aga selleks, et seda, siia saaks tulla juurde ka huvikaitse ja erasektor, selleks ongi just seda avaandmete infrastruktuuri vaja. Et riigi enda jaoks meil on ju olema siiste, kus me oleme absoluutselt nagu. Aga
kui näiteks Tallinna linnavalitsus tahaks oma liiklusvoogu siin analüüsida sama peenelt, kas nad täna saaksid seda põhimõtteliselt teha või ei saaks?
Nad põhimõtteliselt täna saaksid seda teha küll. Aga seal ongi see, et sa pead tegelikult agregeerima kokku andmeid erinevatest asutustest, et me võtame sealt Maanteeameti PPA. Et muidugi sellega tegeletakse, aga see oleks lihtsalt uus hoop seda teha. Ja ongi, et see väga tähtis osa on tegelikult eraettevõtlusel, kellel tekib läbi selle uusi võimalusi luua teenuseid, millele me võib-olla avalikus sektoris ei mõtle nii palju. Et see, see ei ole ainult see, et me suudame nüüd vähendada enda halduskoormust, see on pigem see, et äkki tullakse lahenduste peale, mida me ei ole tulnud varem. Et see on see kasu tegelikult sellest.
Mis seisus see asi täna Eestis on, kas mõned asutused annavad välja niimoodi avaandmeid kenasti viisakalt või pigem te peate käima nii-öelda nüüd uksi ja, ja seletama nullist, et mida nüüd kõik peaks tegema?
No Eestis on avaandmete olukord asutuste lõikes väga erinev. Et see oleneb, kuidas siis see meeskond on ise suutnud selle protsessi käima lükata, sest. Avandmete avaldamine ei ole niisugune ühekordne tehniline arendus, et see hõlmab ikkagi terve andmekäitlusprotsessi läbimõtlemist ja seetõttu ei ole seda ka nii lihtne teostada. Et sageli on vaja mõelda ümber ka muud protsessid, peale siis mingi IT-osakonna töö korraldamise. Ja mul on hea meel, et Ott tõi just selle linnaruumi näite, sest just Tallinna linnas on väga palju avaandmeid. Et, ja need on väga värskelt avaldatud kuskil selle suve alguses, nii et ma soovitan kõigil sinna vaatama minna, just igasugused ruumiandmed ja, ja muu statistika.
Tallinna linnavalitsus annab, annab välja selliseid asju.
Jah. Ja, ja siis meil oli just nüüd see avaandmete infopäev, kus oli ka Helsingi linna esindaja, et kui meil on sageli olnud see põhjendus, et Eesti turg on väike, Eesti andmed on nagu väiksed ja ei ole erasektorile võib-olla nii huvitavad. Siis, kui needsamad andmed panna kokku juba Helsingi linna andmetega, siis me saame sellele asjale hoopis uue mõõtme, piiriüleste teenuste kontekstis.
No näiteks, ma mõtlen, mis nendega teha saab, et kuritegevuse statistika Tallinnas versus Helsingis, kus see ühisosa on?
Transporditeenused, kui võtta transpordisektor, näiteks.
Lähme edasi, mis seal siis teha saaks?
Ühildada igasuguseid sõiduplaane, kuidas sujuvamalt korraldada transporti.
Noh, et kui soomlased tahavad tulla Eestisse šoppama, et siis nad hakkavad näiteks Espoost hommikul tulema, lähevad laeva peale ja siis jõuavad siia ja siis tahavad minna Ülemiste keskusesse näiteks, et siis tekiks selline nagu voog või?
Et tulevad inimesed kokku, istuvad maas, panevad andmed kokku, et
mis sealt siis võib tulla, teoreetiliselt, kui me unistame.
Kui vaadata, mis Helsingi on teinud, siis nemad just arendavad oma linnaruumi läbi avaandmete ja just lasevad eraettevõtetel ja kogukonnal seda teha. Planeerida paremaid jalgrattateid ja, ja siis samu neid bussigraafikuid ja muid selliseid keskseid graafikuid ühildada paremini. Kui me läheme sellistesse kohtadesse, kus. Kus ei ole linn, on ju, kus on maa, on ju, et siis äkki me võiksime ka nende sõidugraafikute ja lastetrenniaegadega ka kuidagi paremini hakkama saada niimoodi, et inimeste elu oleks lihtsalt palju kergem, kui puss käib üks kord päevas. Sa
mainisid politseid, et ma saan aru, et politsei annab ka mingisuguseid andmeid Eestis välja.
Jah. Nad annavad välja, hetkel on vist liiklusrikkumised, kuriteod, kas ma jätan midagi mainimata?
Pigem väärteod siis avalikus ruumis, et kui midagi on juhtunud, siis see, see kellaaeg ja, ja koht on ära märgitud. Kuigi siin tuleb nüüd hästi, see on väga hea näide, sellepärast et siin on isikustatud andmed, mis on ilusti ära anonüümiseeritud, et see koht ei ole täpselt nüüd see koordinaat, kus see asi juhtus, vaid ta on paigutatud. Ühele ruudule juhuslikult, aga enam-vähem ikkagi saame juba linnaosakaupa teada, et mis, mis selles linnaosas juhtub.
Kuidas see protsess nagu puhttehniliselt on, et neid, neid andmeid tekib ju iga sekund juurde, eks ole, kogu aeg midagi toimub. Et kas, ma ei tea, tehakse andmebaasi kord nädalas mingi täiendus või ongi kuskil, kuskil Eestis on mingi veebileht, kus kogu aeg tiksub peale, kui ma oskaks vaadata.
Ma, jah, ma arvan, et see ei ole esiteks ühtne, et mõni uuendab kuus korra endale andmekogu, mõnel on see näiteks Tallinna ühistranspordi bussiliiklus, see on reaalajas uuendatud. Et seal ei ole ühtset lähenemist, pigem ongi see, et peaks olema läbinähtav, et millal on andmed uuendatud ja ma olen seda meelt, et hetkel seda tihtilugu seda infot ei ole juures.
Jah, see nüüd, me jõuame sinna, et kuidas avaldada avaandmeid, nii et nad ka kasu tooksid ja seda me räägime just avalikus sektoris, et kuidas neid andmeid siis nii välja anda, et nad oleks ka kasutatavad. Et, et peaks siis olema selge, et millal andmeid avaldatakse kogu see muu info. Mis ei ole nüüd konkreetselt seal tabeli ruudu sees, vaid kogu see kontekst, kuidas need andmed kokku pannakse, et see oleks ka avaldatud ja selgitatud, siis saab tehnoloogiahuviline. Start-up ettevõttes tegelikult seda kasutada mõnel häkatonil prototüüpimiseks.
Aga tüüpiliselt ma arvan, et no antakse siis mingisuguse voona, RSS-i või ma ei tea, mingi, mingi muu sarnase asjana või?
Ei, on igasuguseid erinevaid võimalusi. See
ka paneb Exceli üles näiteks.
Jah, aga Excelit ja CSV-d pannakse üles, et, et selliste praktikate kogumine ja siis ka standardiseerimine mingil määral on, seisab meil nüüd ees, et kui rääkida, mis meie tulevik toob, sest.
Kui ma tahaks ikkagi, ma ei tea, välisõhu kvaliteedi ja kuritegevuse andmed kokku panna, et siis võib juhtuda, et mul on kaks väga erinevat andmebaasi ja ma pean ikkagi käsitsi vaeva nägema, et, et noh, seda kuidagi ühtlustada.
Jah, ja meil on tegelikult ka andmete kvaliteet on ka täiesti seinast seina, et see ongi see, miks meil koostöös Oke'ga meil tuleb ees võib-olla selline tihedamad tööaastad, et kvaliteet on tegelikult ongi. Mõni asutus on väga eeskujulik, toon Tallinna linna, aga kui me räägime üleüldiselt nagu riigist, siis on meil kokku üldse kolmkümmend üks asutust, kes on andmeid avalikustanud. Ja neid andme setter ja äkki vist kaheksakümmend kaheksa, mis praegult avaandmete portaalis kättesaadav on, seda on väga vähe. Seal mõne puhul ongi, et uuendatud viimati kolm-neli aastat tagasi või siis isegi lingid on maas juba. Et tal ei olnud siiamaani sellist püsivat. Et me loodame seda siis tõesti muuta.
Aga kas ta noh, ütleme riigiasutused ja avalikud asutused teevad midagi siis, kui seadusmäärus eeskiri seda ette näeb, eks ole, et nad ei hakka lihtsalt üldjuhul, eks ole, oma. Ma ei tea, entusiasmist või, või vabast ajast ju seda tegema, et kas, kas meil on mingisugune nõue neile või nad teevad seda sellepärast, et on huvitav?
Ja, meil on avaliku teabe seaduse nõue, mis kohustab alates aastast kaks tuhat viisteist kõiki andmeid siis avalikustama avaandmetena.
Ahah, ja siis ma saan aru, et väga paljud asutused lihtsalt ei, ei ole veel tutvunud selle punktiga.
No ta on tutvunud mingil määral, et ehk siis mingisugusel kujul on need andmed avalikud, nagu ma just alguses ütlesin. Et, et meil on info kättesaadav, aga ta ei ole sellisel viisil kättesaadav, et see ökosüsteem toimima hakkaks. Et minu arust on väga oluline aru saada, et selle ökosüsteemi toimimiseks on vaja natuke lisategevusi teha. Näiteks kvaliteedi tagamine ja nii-öelda need kommunikatsioonitegevused, et see ei ole ainult tehniline küsimus.
Aga kust ma olen, kui ma olen arendaja ja huviline, et kust, kuidas ma otsin näiteks seda või? Kas on mingisugune üks koht olemas Eestis, mis need kõik koondab või kust ma leian need?
Praegu on meil töös OpenDataRiik.ee lehe uuendamine, et kui keegi on seal varem käinud, siis ta on saanud aru, et see võib-olla ei ole nagu väga kasutatav koht. Et nüüd me teeme uue hooga ja, ja, ja hästi põhjalikult seal nüüd sellist rehitsemist. Et ta saaks kasutatavaks kohaks ja hakkaks tulevikus kogu seda infot koondama, et kuidas neid andmeid kasutada, mis andmed seal on ja ka anda infot siis definitsioonide ja kõige muu kohta.
Või kas see on selline kohustuslik üks koht, kuhu nad tiksuvad või siis ikkagi on nii, et iga asutus võib panna ka kuhugi, teha oma kodulehele ühe väga vaevu leitava koha?
Jah, meil on tegelikult ikkagi, lähenemine on see, et andmed hakkavad olema asutuste enda kodulehel, aga me hakkame viitama. Et avaandmete sellest portaalist saab nii-öelda selliste linkide kogum. Ja meil see uus portaal, vist ütlen kuulajatele ka ära, et tuleb novembri alguses, tuleb kõige hiljem välja. Ja me paneme seal rõhku ka selle peale, et mis rakendusi on tehtud tegelikult avaandmete pealt. Et inimesed saaksid maigusuhu näha, mille jaoks üldse avaandmeid saaks kasutada.
Hüva, aga teemegi siia pausi ja siis ma tahakski nendest näidetest rääkida edasi. No Restart läheb edasi, meil on külas Mare Leena Saar ja Ott Velsberg ja me räägime avaandmetest ja jääme pooleli selle koha peale, kus tekib küsimus, et. Sa juba kaks näidet tõid, eks ole, need olid USA-st, aga räägime näidetest, mida on nii Eestis kui maailmas avaandmetega tehtud, mis on kihvt ja kasulik?
No ma tooks kõigepealt võib-olla Eestist, meil on olemas selline lahendus nagu riigiteenuste rakendus ja sealt on võimalik näha siis. Kuidas on, mis teenused on üleval, mis mitte. Teine, millest on tõsiselt kasu olnud, on siis läbipaistvus, on näha, kuidas omavalitsustel, riigiasutustel on rahaasjad paigas. Ja kui meil olid siin kohalike omavalitsuste ühinemised, siis tegelikult seda infot kasutati väga palju ühinevate omavalitsuste vahel. Et näha ära, kas sul on rahaasjad korras, kas meil on mõistlik üldse istuda sama laua taha? Et sealtpoolt paljud vaidlused ja selline usaldamatus sai tegelikult lahendatud.
Mis andmete põhjal seda, seda saab väita, et kas omavalitsuse liikus on rahaasjad korras?
No see konkreetselt ongi siis eelarveandmed, tulevad otse, otse, otse nähtavale, siis kuhu kulutatakse ja kuhu ei kulutata.
Okei, no veel?
Siis mulle endale lemmiknäide on Soomes, Helsingis nad tegid sellise rakenduse pimedatele, blind square. Ja selle rakenduse mõte oli aidata pimedal linnaruumis hiigelda. Seal, näiteks kui kodaniklikub ringi, ta annab teada, et ahah, sul paremat kätt on näiteks Tallinna linnavalitsus. Lähed sealt majja sisse, sul on kolmandal korrusel on täpselt see asutus, keda sa otsid. Ja ta ongi väga selline universaalne lahendus inimesele hakkama saada. Siis, mis Helsingi linnas veel tehtud, ma ütlen ausalt, Helsingi linn on tegelikult väga suuresti eeskujuks. Seal hakati andmeid analüüsima, vaatama, kus kohta võiks teha erinevaid jäätise kioskeid. Kus on, kus on, kus on, ütleme nii, et kus on nõudlust. Ja vaadati, et ahah, sealt on hästi suur jalgratturite liiklus, aga kogu selle mingi kilomeetrise jupi juures ei ole mitte ühtegi söögikohta, jäetise putkat, mitte midagi. Ja siis üks väga selline ettevõtlik. Poe müüa, otsustas ah, ta teeb enda kioski sinna ja Helsingi linna vähemalt see nii-öelda jutt on see, et sellest on saanud täielik hitt.
Et tegi õigesse kohta?
Tegi täiesti õigesse kohta ja nüüd ongi tegelikult Helsingi linn kasutab seda sama lähenemist ka ise, et pakkuda välja, kuhu võiksid uued ettevõtted teha enda nii-öelda väikeseid poekesi.
Et selle aluseks siis ma kujutan ette, on mingisugused liikluskoormuse andmed.
Jah, täpselt.
Mida ka, kuidas nad koguvad neid, huvitav. Mis andmed saavad, kust nad teavad, mitte jalgratturit kuskilt sõidab?
No meil tegelikult Tallinnas ise on Kalamajal, Kalamajas on Kalaranna tark tee näiteks, samamoodi kogutakse juba praegult. Palju on jalgrattureid, palju on jalakäijaid, palju on autosid, õhukvaliteeti. Et lihtsalt me peaksime sedasama asja tegema suuremal skaalal ja siis muutma andmed ka kättesaadavad.
Nii et tänav ise saab aru, kes seal peal sõidab? Täpselt. See kõlab küll päris, see on, see on ulme ju, kuidas? Ma isegi ei oska seisukohta, kas see päriselt on niimoodi olemas, juba Tallinnas ka, et meil on tänav, mis saab aru, kes seal peal sõidab.
Jah, ja mis meil tegelikult, siin testitakse ka selliseid variante, et näha ära, kas jalgratturitel on näiteks isegi kiivrid peas.
Ahah, ja see võib-olla saab ka kohe trahvi koju saata.
No loodame, et seda mitte. See on pigem ikkagi, mõte on liiklusvoogusi planeerida paremini.
Okei, Eestis on vist tehtud ka mingisuguseid riigieelarve asju, ma ei tea, kas nad on avaandmetega seotud või on igasugused visualiseeringud ja, et palju riik on kuhu kulutanud ja kust mingid tulud on tulnud.
Ja seesama, sama näide oligi see riigi raha rakendus, et täpselt samad andmed, et nii, see on hea näide, kuidas ühest andmekogumist saab väga palju erinevaid rakendusi. Ja andmekogu avaldades on omanikul raske ette näha, mis need kõik need rakendused saavad olema. Mis, mis on nagu keeruline sellises kontekstis, kus me peame projekti lõpus väga hästi ette, ära nägema, mis on selle projekti tulemused ja põhjendama seda investeeringu nii-öelda tulusust. Et avaandmete avaldamine, mis on üsnagi kallis ja mahukas protsess, tegelikult on selline natukene tundmatusse minek ja seda, seda on raske teha ja see võib olla ka üks põhjuseid, miks meil on seni nii vähe seda tehtud.
Mulle see näidete asi hakkas meeldima, on teil veel tuua põnevaid
näiteid? Näiteks, näiteks me Eestis visualiseerime ära praegult õhukvaliteedi, et kus on erinevad allergeenid ja sa näed ära siis näiteks vaata astmaatik, et kas sa peaksid sinna piirkonna liikuma või mitte. Ja kui me võtame sellesama näite ja nüüd lisame natukene veel rohkem sellist jõudu juurde, siis Louisville Kentakis USA-s, mis nad tegid, on, on, neil on selline rakendus nagu if, this, then that. Ja nad kasutavad sedasama õhukvaliteedi näitajaid, et astmaatikutele siis Philipsi hõvelampidega anda märku, kas ta peaks üldse täna kodust välja liikuma või mitte. Ja nad otsustasid, et nad lisavad veel sinna kolmanda kihi, et hakkavad veel andmant juurde koguma, hakkasid astmaatikute nii-öelda respiraatori kasutusandmeid. Et kui astmaatikul on probleem, kasutab omal respiraatorit, siis ta saab selle info ka kätte. Ja kui nüüd lisada see koos õhukvaliteedi andmetega kokku, siis saab tegelikult oluliselt parema pildi, kus kohas võib olla näiteks praegult õhu, õhukvaliteediga probleeme.
Jah, ja kui noh, tegelikult ma ei tea, mis kõik võiks välja tulla sellest, kui me paneme mitte üks-kaks-kolm, vaid võib-olla näiteks kümme või ma ei tea, kolmkümmend erinevat andmebaasi kokku, et tõenäoliselt on seda teadmist ja igasugu huvitavaid avastusi on ju andmetes hästi palju peidus, aga jube raske on ju analüüsida seda. Jah. Niimoodi, et vaatad kümnele andmebaasile peale ja ütled, ahhaa.
Ja praegune meie infrastruktuur ei võimalda seda, et seal sa saad mingisuguseks teenuse osutamiseks küll küsida väljakaupa igasuguseid andmeid igasugustest erinevatest asutustest, aga see, millest just Henrik praegu rääkis, oligi see andmeavastamine ehk data discovery. Mis ikkagi eeldab seda, et sul on ligipääs kogu andmebaasile, mitte ainult väljakaupa.
Jah, ja siis paned sinna mingi analüüsi peale ja võib-olla, võib-olla saad midagi teada. Ja võib-olla
ei saa ka midagi, võib-olla saad lihtsalt niisuguseid toredaid korrelatsioone.
Jah, no ma midagi, ma ei mäleta või ma ei teadnud, kas see politsei kuritegude asi, millest te rääkisite, et see, see toimib Eestis praegu, eks ole. On kuskil minu meelest mingi veebisood, kust mina olen vaadanud Eestis mingisugust kaarti, kus, kus need ikoonid olid peal, et siin, siin rööviti kedagi ja siin oli õnnetus ja midagi sellist. Et jällegi jube raske öelda, et ma vaatasin ka seda oma kodukandi, siis vaatasin ka üle, aga noh. Lõpuks kippus ikka selguma see, et, et kuritegusid on rohkem seal, kus inimesed käivad. Et kui sul on kuskil mingi koht, kuhu nad koonduvad, eks ole, ma ei tea, on see mingi rongijaam, bussijaam või mingi suur tänav, et noh, siis seal juhtub rohkem. Et eks, ma arvan, et see on tihti hästi selline keeruline küsimus, et kas me nüüd saime midagi teada või ei saanud midagi teada. Aga noh, samas astmaatikud, ma kujutan ette, on õnnelikud selle üle. Kes on maailmas üldse kõige kõvema, nagu avaandmete tegija, Helsingit sa juba mainisid.
No kui me räägime riikide poole pealt, siis erinevate näitajate poole pealt on Suurbritannia, ta on maailmas top üks.
No mida nemad teinud on siis, kuidas see neil nii hästi on läinud?
No ma arvan, et siin võib-olla tuleks vaadata ka, miks meil Eestis avaandmed ei ole nii heas seisus. Meil on olemas tegelikult andmevahetuskiht. Me saame riigiasutuste vahel andmeid vahetada oluliselt lihtsamalt. Aga samasugust võimalust ei ole paljudes teistes Lääne-Euroopa riikides. Ja seal ongi avaandmed tegelikult viis ka riigiasutuste vahel andmete vahetamiseks. Et see ongi, et meil on tegelikult endal võimalused olemas ja me ei ole siiamaani avaandmeid pidanud ka avalikustama.
Aga no sinna tavaline kodanik, eks ole, ligi ei saa ju. Kui läbi X-tee mingid andmed liiguvad kolme asutuse vahel näiteks siis, nad ei ole ju, nad ei pea olema ka anonümiseeritud, nad võivad sel juhul täitsa isikustatud ju olla. Et siis me noh, ei noh, asutused on asutused, et siis me ei saagi sinna ja me ei saa teha, põhimõtteliselt me võiks teha X-tee lahti, ma saan aru. Öelda kõigile, et pärige, mida tahate, et siis meil oleks palju av
No see, see, see nagu sa juba just rõhutasid, et seal on isikustatud andmed, et päris lihtsalt kraani me X-tees, teele külge panna ei saa, et siin seda problemaatikat on päris palju. Võib-olla te olete juba rääkinud sellest uuest isikukaitse määrusest, GDPR-ist. Et see, see on just ju tulnud, et tegelikult me peame kõike seda vaatama ka selles kontekstis, et andmed on lihtsalt andmed, et. Osad on isikute kohta ja osad on selliste asjade kohta, mis saab kindlasti vabaks anda ja siis on terve ports keskel, mida tuleks kuidagi kas töödelda või natuke sügavamalt mõelda, et mida nendega teha saab, et andmed on lihtsalt andmed, et küsimus on nendes barjäärides, kuidas neid välja anda.
Kas meil riigiasutustel on ka mingid eelarved ette nähtud selleks, et ma kujutan ette, et see tõesti on päris kallis, et selline otsus vastu võtta?
Meil on tegelikult olemas struktuurfondidest toetus, see on kokku vist pool miljonit per projekt. Et tegelikult see meede on olemas, mida ei ole olnud, on huvilisi, kes sooviksid seda meedet kasutada. Et meil on tegelikult raha taha, see ei peaks kunagi jääma. Pigem ongi see, et meil peaks olema siseliselt arusaam, et see on vajalik asi.
Aga miks seda siis ei ole ikkagi? Kui me te räägite, nii palju toredaid näiteid on, noh, maailmas tehakse, seadus on ka, et pead tegema, miks ei ole?
No esiteks, ma mainisin ka, et meil ongi tegelikult riigikasutustel endal seda sisemiselt vaja ei ole. Meil on olemas X-tee, sa ei pea kasutama avandmeid. Aga samal ajal sealt tulebki see näiteks isikukaitse küsimus. Et kui ma nüüd avalikustan selle andmekogu, kas seal on võimalik kuidagi näiteks ka linkidest teise andmekoguga tuvastada ära, kes see isik seal taga näiteks on? Et kui me vaatame, et näiteks kaheksakümne aastane Maali kuskilt kindlast linnast ja seal on näiteks mingi puusaprotees või ta on kukkunud kuskil, siis suure tõenäosuse oskad öelda täpselt ära, kes see on. Ja. See ongi tegelikult väga suur probleem, et meil on olnud näiteid siin suve keskel, kus veevõtukohad näiteks, info veevõtukohtade kohta. Sõidad tänaval ringi, sa näed ka sellised suured ilusad punased torbikud. Nii, noh, tundub, et ei ole midagi, aga samal ajal tegelikult see on jällegi julgeolekurisk. Kellelgil on siis ligipääs kõikidele veevõtukohtadele üle Eesti. Et kui ta tahaks midagi väga halba teha, siis tal teoreetiline võimalus oleks. Et noh, mingil määral on tunne, et see on nagu õhust, õhust natukene imetunud.
Aga mine tea.
Aga mine tea. Ja siin ongi tegelikult see, et sa pead tihti ikkagi ennem läbi mõtlema, et kas ma nüüd teen selle andmekogu avalikuks, kas see on piisavalt hästi anoniseeritud või mitte.
Nojah, ja kui on veevõtupunktide asukohad, siis no mis sa seal ikka anonümiseerid, et sa pead ju näitama nad siis ära, et kus nad siis asuvad, et see ongi see andmekogu ju, see ongi selle mõte. Neid rakendusi, mida te enne kirjeldasite, kes need tüüpilised siis nagu ehitama hakkavad või kes need täna ehitavad nende, nende avaandmete peale, kas need on riigiastustesid ise või need on mingid tudengid, kus õppejõud ütles, et peab tegema?
No väga, noh, siiamaani on väga tugev ikkagi kogukond olnud ülikoolide poole pealt, et sealtpoolt tehakse rakendusi. Meie poolt mainitud näited on paljuski tehtud tegelikult riigi enda vahenditega.
Ja ka, ka Helsingis ja ka USA-s ja. Või on seal erasektor, ma seda olen öeldud, kas, kas, kas erasektor tunneb tegelikult huvi selle vastu või, või on ka seal olukord, et, et see on nii uus valdkond kõigile, et keegi nagu pole isegi mõelnud selle, sel teemal?
No Londonist me just rääkisime või siis Suurbritanniast, et Londonis on ju transpordirakendusi hästi palju. Aga seal on ka kümme miljonit inimest, et loomulikult siis on hoopis teistsugune huvi nende andmete vastu. Erasektori poolt, et sinna mingisuguseid rakendusi peale ehitada. Meil on ka häkatonidel olnud avaandmed täiesti selleks sisendiks, aga, aga siis see eeldab seda, et need andmed on hea kvaliteediga ja kõik juba valmis, et ma arvan, et meil praegu ei ole see valmidus nii suur, et sinna saaks kohe tulla ja prototüüpida mingisugust oma, oma ideed peale.
No kuritegevuse kaardi sai teha, aga samas on ka tüüpiliselt selline asi, et noh, mul on, siin istudes on jube raske mingeid ärimudeleid sinna külge mõelda, et, et kes siis nii väga huvitatud oleks sellest, et ma. Kodanikuna ma ei ostaks tõenäoliselt sellist kaarti, ma ei usu, kinnisvara arendajana ma pigem tahaks, et seda kaarti ei oleks. Tõenäoliselt, et väga raske on mõelda, et kes oma raha eest peaks siis hakkama seda tegema või, või, või ei ole tegelikult raske või?
No linnaruumi andmed, ma arvan, on siiski väga huvitavad ka erasektorile, et eriti kui Tallinn on siin hoogsalt välja tulnud, siis siin nii väikeste äride omanikele kui siis ka kinnisvara arendajatele ja teistele teenusepakkujatele hakkavad siit tegelikult võimalused praegu avanema. Nüüd on vaja lihtsalt süveneda ja, ja, ja neid ideid pakkuda, et võib-olla kohe inimesed ei oska selle peale mõelda, et siit võib mingisuguse ärimudeli välja mõelda.
Nojah, kui ma restorani teeks, siis ma tegelikult tahaks teada, kummal pool tänavat, mis kelli inimesed kõnnivad, näiteks.
Jah, täpselt.
Hüva, me teeme siia teise pausi ja siis lähme edasi. Nii, Restarti saade jätkub, me räägime avaandmetest ja vaatame siis sinna tulevikupoolele ka, et mis. Milline see selline ideaaltulevik oleks, mille, mille eest teie seisate, et kõikide asutuste kõik andmed on standardiseeritud kvaliteetsel masin loetaval kujul igal pool olemas, võta ja hakka pihta.
Ma arvan, et see oleks väga hea visioon, kuhu me tahaksime jõuda.
Jah, eks praegu ongi see info ühtlustamine kõige olulisem töölõik, et asutused kõik saaksid aru, miks andmeid on vaja avada. Et inimesed teaksid, et sellised protsessid käivad, neil oleks üks koht, kus nad saavad vaatamas käia, kus nad saavad andmeid küsimas käia, et selline idee mul on, kas selline arendus on plaanis. Kõik ühekorraga ei juhtu, et kindlasti neid andmekogusid avatakse mingisuguse aja jooksul. Aga meil on vaja teada saada, kus see huvi on, et meil on vaja kokku koguda kogu see nagu huvi ka erasektorilt ja kogukonnalt, et see on huvitav.
Ja teiseks, ma arvan, et mis on sama tähtis, me peame tegelikult ka ühiskonnas laiemalt tekitama võimaluse andmetest aru saada. Ja see läheb kogu sellise andmeanalüütika ja masinõppe poole pealt läheb edasi. Et inimesed, kui nad näevad neid andmeid, neil oleks oskus, kas neid siis analüüsida või siis kasutada nii-öelda olemasolevaid lahendusi, et neist aru saada. Et me peame tegelikult ka ühiskonnas laiemalt tekitama seda.
Aga, aga mis sa selle ajal täpsemalt mõtled, et kas me peaksime seda kuidagi kooliprogrammi lülitama või tegema mingisuguse kampaania või, et noh, arvutid saavad andmetest aru, inimesed juba noh, oma ehitustlikel iseärasustel ei saa.
No ma üldiselt, ma arvan seda, et me peame ka ülikooli tasemel tegelikult oluliselt rohkem väärtustama andmeanalüütikat. Et ta ei peaks olema ainult informaatika eriala, vaid sinna võiks olla oluliselt multidistsiplinaarsem. Et kui me räägime näiteks tänasel päeval andmeajakirjandusest, siis see on täiesti uus lahendus, kuidas teha ajakirjandust. Ja meil koostöös Oke-ga tulebki nüüd novembri alguses.
Ja, esimesel novembril. Tuleb. Andmeajakirjanduse töötuba, me teeme siin igasuguseid üritusi selleks, et neid erinevaid valdkondi tutvustada ja andmeajakirjandus on olnud üks valdkond, mida me siis natuke omalt poolt nügime, sest see on Eestis üsna. Üsna sihuke hobi, hobitasemel praegu, erinevatel põhjustel. Et seal siis õpetada ja kuidas seda paremini teha niimoodi, et seda, see muutuks sihukeseks. Normaalsuseks, normaalsuseks, praktikaks, et siis me saame ka sealt teada, mis andmeid vaja rohkem on just selle valdkonna jaoks.
Jah, ma noh, ajakirjanduse poole pealt ma võin öelda küll, et miks see huvi tõenäoliselt on ju suhteliselt väike või mitte nii suur, kui te tahate, et ta oleks, sest see on meeletult kallis. Et ühe sellise noh, ütleme ühe artikli üks ajakirjanik kirjutab ühe päevaga valmis, on ju. No olenevalt artiklist, noh, mõnikord läheb kolm-neli päeva, on ju, võib-olla läheb isegi nädal, mis on suhteliselt haruldane, ma arvan, Eestis, aga andmeajakirjandust üks ajakirjanik ei tee. Sul on vaja ajakirjanikku ja sul on vaja mingit visuaali poolt sinna juurde ja sul on vaja tõenäoliselt programmeerijat sinna juurde, et selle oma, selle ühiku omahind, noh, mitmekordistub, kui mitte rohkem, võib-olla kümnekordistub. Võrreldes tavalise artikliga, et ta lihtsalt väga paljudel väljaannetel ei ole kuluefektiivne tegeleda sellise asjaga, et sa saad ühe artikli, aga sa oled hirmsama raha sinna ja ressurssi sinna alla pannud. Et võib-olla on nendel teistel erasektori asjadel ikka, ettevõtetel samamoodi, et, et need andmete tegele, andmetega tegelemine on kallis ja noh, programmeerijat Eestis, eksamine ja palk on ju, suhteliselt keeruline on täna. Aga mis valdkonnas teil Eestis on suuremat huvi selle vastu olnud ja kas on võimalik välja tuua mingit valdkonda, et, et tõesti, et need seal said aru küll, mis me rääkisime ja hakkasid kohe tegema?
Sellist valdkonna põhist statistikat me ei oska kohe peast tulistada, aga ma arvan, et selle esimese nüüd tsükli järgi peale seda, kui me avaandmete portaali oleme ka uuesti tööle saanud. Siis me hakkame seda küsima kindlasti, et me tuleme selle küsimusega, et mis andmeid teil on vaja just selleks, et meil ka väga selgelt see pilt tekiks. Sest siis me saame prioritiseerida, missuguste andmete avamisele rohkem rõhku panna, kuhu rohkem enda tuge anda.
Huvitav, mis ametikoht üldse peaks olema või mis, mis haridus või ettevalmistus peaks olema inimestele, kes nende andmekogudega töötama hakkavad? Et noh, lihtsalt, et ma olen arendaja, see otseselt ju ei tähenda, et ma oskan neile, neile andmebaasi kokku panna, püstitada probleemi, leida lahendust. See peab mingi teistmoodi asi olema.
See ongi interdistsiplinaarne valdkond, et siin on erinevad kompetentsid ja erinevad inimesed. Oleneb muidugi ka, missuguses vormis need andmed on, kui nad on juba väga heas, hea kvaliteediga ja hästi esitatud andmed, siis võib-olla tähendab mingisuguse. Võimeka analüüsi tööriista sinna taha ühildamist, mis on ühekordne töö ja siis sa saad seal seda andmetesse sukelduda ja hiirega lohistada erinevaid tulpasid ja, ja ehitada seda lugu sinna peale, et siis võib-olla see ühiku hind läheb ka oluliselt.
Muidugi, siis täna me oleme olukorras, et me peame hakkama noh, haamrit ja saagi ja eks ole, kõike nagu nullist ise tegema, on ju, kui me hakkame neid andmeid analüüsima, et. Ei ole mingit sellist kõigile arusaadavat keskkonda, et klik, klik ja lugu valmis.
Jah, on, on selliseid keskkondi, aga me ei tea praegu, mis see kõige parem oleks, aga me liigume sinna suunas, et suunata inimesi vähemalt selle õige tööriista juurde. Kui ta ei ole programmeerija.
Aga kui on.
Siis ta saab endale ise igasuguseid toredaid rakendusi ehitada, siis tal piisab tegelikult nendest otsadest. Ja need otsad juba on olemas.
Ja meil ei ole samamoodi tegelikult ju riigis piisavalt palju, kes tegelevad andmeanalüütikaga. Aga see ei tähenda seda, et sul ei ole võimalusi andmeid analüüsida. Et kui meil on olemas näiteks tabloo, see on tegelikult ikkagi selline piisavalt entry level võimalus andmeid analüüsida. Et meil ei ole praegult see nõue, et kõik peavad oskama nüüd Aari või Pythonit. Vaid pigem me saame ka anda neile tegelikult selliseid valmislahendusi, millega nad saavad oma analüütikat teha. See on lihtne, näiteks ise ülikoolist, meil oli tudengitele, kes ei saanud. Näiteks Harri või Pythoni siis keelega hakkama, meil oli alati selline kolmas variant, et nad võivad võtta siis Tableau rakenduse, et nad teevad selle pealt siis oma analüütikat. Ja selle, selline õppimiskirv on oluliselt väiksem, kui me räägime näiteks Pythoni või Harri puhul.
No avatud andmetele. Avalike graafide tegemine on väga paljude võimekate tööriistade nagu promomiseks tasuta, nii et avaandmed on väga hea võimalus katsetada ja siis oma tööd ka välja näidata ja jagada.
Selge, nii et ideid on vaja kõige rohkem, mulle tundub. Aga, ja ideed ikkagi tulevad, ma saan aru, et kui nüüd nii keeruline valdkond, et siis pigem ikkagi tulekski panna erinevate valdkondade inimesed kuidagi kokku ja suhtlema, et ühel on küsimus ja teisel on natukene vastust ja kolmas läheb teostab ära või?
Jah, selline prototüüpilise lähenemine on praegu kõige, kõige parem, sest siis sealt tulevad ka välja need probleemid, näiteks kui me teeme selle andmeajakirjanduse töötoa, siis. Siis me teamegi, ah siin ongi see küsimus, et sellega peabki nagu rohkem tegelema, kõike, kõiki probleeme ei ole mõtet ise välja mõelda, tuleb inimeste käest küsida, mis neil vaja on.
Selge, aga ma tänan teid saate eest, meie, meile eraldatud aeg on läbi. Tutvuge siis, head kuulajad, avaandmete teemaga ja vaatame, milline see tulevik siis Eestis aastate pärast on, kas on andmed lahti või ei ole. Aitäh kõigile kuulajatele ja kohtume uuesti nädala aja pärast.