Yritystilaus tunnistettu

Voit käyttää palvelun kaikkia sisältöjä vapaasti. Jos haluat kommentoida, kirjaudu sisään henkilökohtaisella Mediatunnuksella.

Teknologiaguru Tatu Ylösellä Suomen suurin yksityinen kirjasto Loviisassa - kehittää tekoälypohjaista sovellusta tietolouhintaan

Tiede: Tunnettu teknologiaguru kehittää loviisalaisessa hallissa tekoälypohjaista sovellusta, joka saattaa haastaa jopa Googlen. Ylösen kirjastossa on yli kaksikertaa enemmän kirjoja kuin Loviisan kaupungin kaikissa kirjastoissa ja varastoissa yhteensä.

Loviisan vanhalle teollisuusalueelle, E18 -tien kupeeseen, Elteten entiseen halliin on viime kuukausien ajan kuljetettu lavakaupalla tieteellisiä kirjoja ja julkaisuja.

Rakennuksen noin 3 000 neliömetrin suuruisessa yläkerrassa, jota paikan ja siellä toimivan Clausal Computing Oy:n omistaja Tatu Ylönen kutsuu käsikirjastoksi on yhteensä noin 20 000 nidettä. Pääosin englanninkielisiä tiedejulkaisuja.

Jos oli yläkerran kirjakokoelma häkellyttävän laaja, on alakerran kirjojen ja julkaisujen kokoelma suorastaan mykistävä. Laajaan teollisuushalliin on tähän mennessä kerätty yhteensä 320 korkeaa kuormalavallista eli yli 200 000 nidettä erilaisia tieteisjulkaisuja. Ja lisää on tulossa.

Määrää voi vertailla vaikkapa Loviisan kaupungin kaikkien kirjastojen kirjamäärään, jonka on 106 123 kappaletta, varastokirjat mukaan lukien.

Ylönen ei kuitenkaan ole lukenut eikä aio lukeakaan kaikkia hankkimiaan julkaisuja. Siihen kuluisi ihmiselämä.

Tunnetun suomalaisen teknologiagurun ja -miljonäärin Tatu Ylösen visio on suorastaan huikea ja kiehtova. Tähän juttuun siitä mahtuu vain pintaraapaisu, mutta aiheeseen on syytä jatkossa vielä palata.

On mahdollista, että loviisalaisessa entisessä teollisuushallissa syntyy muutamien vuosien kuluessa sovellus, joka on seuraava suuri harppaus tiedonkäsittelyn ja tekoälyn kehityksessä.

Tähän mennessä ollaan kehityshankkeen alkuvaiheessa, jossa Tatu Ylönen on kokoamassa valtavia määriä kirjoja ja muita julkaisuja suureen halliinsa Loviisassa.

Jo nyt Ylösen kirjasto on tiettävästi Suomen suurin yksityinen tieteiskirjasto.

– Suurin osa kirjoista on ostettu divareista käytettyinä. Iso osa kirjoista on matematiikkaa. Sitten on julkaisuja tekoälystä, tietokonenäöstä ja kielen ymmärtämiseen liittyviä julkaisuja.

Suurin osa teksteistä on englanniksi, jonkin verran myös suomeksi ja saksaksi, Ylönen luetteli.

Viime viikolla Ylönen kertoi saaneensa lahjoituksena korkeimman oikeuden tuomarin kirjaston, joka oli erikoistunut immateriaalioikeuteen.

Tämä on vuosia kestävä pitkäjänteinen kehityshanke.

Tatu Ylönen

Ylönen ei kuitenkaan ole lukenut eikä aio lukeakaan kaikkia hankkimiaan julkaisuja. Siihen kuluisi ihmiselämä. Niiden tekstit on määrä jatkossa skannata ja siirtää pilvipalvelimissa oleviin tietokantoihin.

Skannaamista varten Loviisan halliin hankitaan automaattiskannereita, jotka skannaavat noin 2 000 sivua tunnissa.

Loviisan hallissa jatkossa tehtävää toimintaa kutsutaan tiedonlouhinnaksi eli englanniksi ”data mining”. Se tarkoittaa joukkoa automaattisia tai puoliautomaattisia menetelmiä, joilla pyritään oleellisen tiedon löytämiseen suurista tietomassoista ja puretaan yleistajuisempaan muotoon. Tiedonlouhinnassa yhdistellään tilastotiedettä, koneoppimista ja tietokantatekniikoita.

Tiedejulkaisujen kerääminen ja niiden tekstien skannaaminen tietokantoihin on osa suurempaa hanketta, jonka tavoitteena on perustaa pilvipalvelimiin valtavia tietokantoja, joista tekoälyn avulla saadaan malleja sekä vastauksia monimutkaisiin kysymyksiin sekä tehostettua byrokraattisia prosesseja.

Sovelluskohteita on Ylösen mukaan valtavasti. Ideana on, että teksteistä tulkitaan tietoja ja tehdään tekoälyn avulla siitä päätelmiä.

– Esimerkiksi, jos joku tekee keksinnön, ja siitä patenttihakemuksen. Patenttivirasto tutkii, että onko tämä keksitty aikaisemmin. He käyvät läpi valtavan määrän julkaisuja ja aiempia patenttihakemuksia. Työn ja byrokratian määrä on valtava.

– Esimerkiksi USA:ssa patentteja haetaan noin 500 000 vuodessa. Patenttiviraston budjetti on noin 2 miljardia (dollaria) vuodessa. Jos heidän prosesseja saisi tehostettua 10 prosentilla niin, että myös laatu paranisi, säästyisi 200 miljoonaa vuodessa.

– Jos siitä vaikka puolet tulisi ohjelmistotoimittajalle, niin he USA:ssa säästäisivät silti 100 miljoonaa vuodessa. Sama voisi tapahtua Euroopan ja Aasian patenttivirastoissa. Esimerkiksi tällainen voisi olla yksi sovelluskohde, Ylönen visioi.

Esimerkkejä käyttömahdollisuuksista Ylösellä on runsaasti muitakin.

– Esimerkiksi kemiallisten tai biologisten reaktioiden kaivaminen on alue, jota tutkitaan laajasti, ja yritetään kehittää synteesipolkuja eli keinoja, joilla tietyntyyppisiä kemikaaleja saadaan syntetisoitua, Ylönen innostuu, ja selvittää kuinka tekoälyn avulla saadaan mallinnettua miten tuhansista aminohapoista koostuvan proteiinin muodostuminen etenee geenien ohjaamana.

Toteutuessaan Ylösen hankkeesta voisi tulla jopa Googlen haastaja. Googlen ominaisuutena on hakusanojen perusteella kerätä listan linkkejä tietolähteistä. Ylösen visioimassa sovelluksessa tekoäly veisi tietojenkäsittelyn seuraavaan vaiheeseen, ja tekisi teksteistä johtopäätöksiä ja antaisi vastauksia.

Tässä on iso (taloudellinen) riski, mutta iso mahdollinen hyöty maailmalle, jos se saadaan tehtyä.

Viittaus Googlen haastamiseen saa Ylösen naurahtamaan, muttei kumoamaan ajatusta.

– Tämä on pitkäjänteinen kehityshanke, jonka tuloksia odotetaan saatavan vasta vuosien päästä, Ylönen kertoi.

– Tämä on aihe, josta kiinnostuin 30 vuotta sitten, ja jo peruskoulussa harrastin näitä aiheita. Teknologian osalta puhutaan noin kahdesta vuodesta, jolloin alkaa olla valmista.

– Tässä on iso (taloudellinen) riski, mutta iso mahdollinen hyöty maailmalle, jos se saadaan tehtyä. Se merkitsi nopeampaa tutkimusta, kun relevantit aikaisemmat julkaisut ja relevantit menetelmät sekä niiden tulosten yhteenveto saadaan tehokkaasti hyödynnettyä sekä sovitettua käyttäjän osaamistasoon, Ylönen kertoi.

– Eli sovellus ottaisi huomioon, että tämä henkilö (käyttäjä) tietää jo nämä ja nämä asiat, joten sovitetaan se yhteenveto siihen tasoon.

Ylönen esitteli hankettaan Loviisan yrittäjien hallitukselle ja paikallismedialle maanantaina. Hän myös kertoi löytäneensä myynnissä olleen sopivan teollisuushallin Loviisasta ystävänsä sekä liikekumppaninsa Heikki Suonsivun vihjeen perusteella. Molemmat asuvat Espoossa, mutta kertoivat ihastuneensa Loviisaan, ja harkitsevansa muuttoa kaupunkiin.

Vuonna 1968 syntynyt Tatu Ylönen tunnetaan Secure Shell -salausprotokollan kehittäjänä. Lisäksi hän on SSH Communications Securityn perustaja sekä suuromistaja.

Hän valmistui Teknillisestä korkeakoulusta diplomi-insinööriksi vuonna 1992. Ylönen jatkoi opintojaan tekniikan lisensiaatiksi vuonna 1994.

Opiskeluaikana Ylönen perusti New Generation Software -yhtiön.

Ylönen kehitti Secure Shell -protokollan vuonna 1995 omaan käyttöönsä, mutta vielä samana vuonna hän perusti SSH Communications Securityn. Muutaman vuoden päästä yhtiön asiakkaaksi tuli Sun Microsystems, minkä jälkeen yhtiö sai mainetta maailmalla.

Loviisaan on tulossa it-miljonäärin kirjojen skannaamo ja tietolouhimo