Aikasarjaennustaminen ja suurten kielimallien mahdollisuudet – Uusi paradigma liiketoiminnan ennakoinnissa

 
 

Aikasarjaennustaminen on ollut pitkään lähinnä tilastotieteilijöiden temmellyskenttää, mutta ei enää. Suurten kielimallien ja transformer-arkkitehtuurin myötä ennustaminen voi muuttua lähes yhtä helpoksi kuin chattaaminen. Miltä kuulostaisi huoltotarpeen ennustaminen ennen kuin kone edes yskähtää?


Aikasarjaennustaminen on tilastollinen menetelmä, jolla pyritään ennustamaan tulevaisuuden arvoja perustuen menneisyydessä tehtyihin, järjestettyihin havaintoihin. Tämä käsittää kaiken myyntilukujen ja varastojen optimoinnista sääennustuksiin ja taloudellisten markkinoiden analysointiin. Pohjimmiltaan kyse on kyvystä tunnistaa datapisteistä säännönmukaisuuksia, trendejä ja syklisyyttä, joiden perusteella voidaan tehdä perusteltuja arvioita datapisteiden tulevista arvoista.

Nykyisten työkalujen haasteet

Perinteiset aikasarjaennustamisen räätälöidyt työkalut ja menetelmät sopivat huonosti notkeaan ja nopealiikkeiseen liiketoimintaympäristöön, eikä niillä juuri ole järkeviä käyttökohteita pienissä tai keskisuurissa yrityksissä. Niiden käyttö vaatii syvällistä tilastollista osaamista ja huomattavia resursseja tulosten saavuttamiseksi.

”Käytännössä tämä tarkoittaa, että tehtävään on varattava todella kovan tason tilastotieteilijä, joka keskittyy pelkkään data-analyysiin”, sanoo Asteroidin vanhempi ohjelmistokehittäjä ja osakas Joona Ojapalo. ”Paradoksaalisesti tämä kallis asiantuntija on aiemmin joutunut käyttämään valtavasti työaikaa datasettien siivoamiseen, sillä vanha tilastoennustamisen totuus on: garbage in – garbage out. Jos datasi on roskaa, myös ennusteesi on sitä.”

Kustannukset erikoisosaajien palkkaamisesta voivat nousta kohtuuttomiksi suhteessa saatavaan hyötyyn. Kuitenkin kilpailu markkinoilla edellyttäisi yhä tarkempaa ennakointia ja nopeampaa reagointia muuttuviin olosuhteisiin.

Suurista kielimalleista aikasarja-kielimalleihin ja zero-shot-ennustamiseen

Suurten kielimallien (LLM) kehitys on avannut uuden tutkimushaaran aikasarjaennustamisen demokratisoimiseksi. Nämä mallit ovat osoittaneet hämmästyttäviä kykyjä käsitellä sekvenssidataa ja tunnistaa monimutkaisia kaavoja. Vaikka ne on alun perin suunniteltu luonnollisen kielen käsittelyyn, niiden arkkitehtuuri soveltuu yllättävän hyvin myös numeeristen aikasarjojen analysointiin.

”Pidän erityisen jännittävänä kielimallien kykyä tuottaa hyviä tuloksia niin sanotussa zero-shot-ennustamisessa”, Ojapalo kertoo. ”Sillä tarkoitetaan mallin kykyä tehdä ennusteita aineistosta, josta mallilla ei ole aiempaa kokemusta, eli se yleistää oppimaansa uuteen kontekstiin. Lisäksi, kun aikasarjaennustetehtävä mallinnetaan tekstintäydennystehtävänä, data-aineiston heikko laatu ei aiheuta enää samanlaisia ongelmia kuin aiemmin.”

Neuroverkkoarkkitehtuureihin kuuluvat transformer-mallit ovat myös osoittautumassa tehokkaiksi välineiksi aikasarjaennustamisessa. ”Ne pystyvät tehokkaasti mallintamaan pidemmän aikavälin riippuvuuksia datassa, mikä tarkoittaa, että ennustaminen ei häiriinny esimerkiksi puuttuvien datapisteiden vuoksi. Transformer-malleissa on eräänlaista sisäänrakennettua robustisuutta”, kuvaa Ojapalo. ”Tämä tarkoittaa, että tällaisista aikasarjakielimalleista voitaisiin kohtalaisen helposti kehittää käytännön työkaluja eri toimialojen prosessien autonomista ohjausta parantaviin ennustustehtäviin.”

Pienten mallien mahdollisuudet ja käytännön ratkaisut

“Käytännössä suuria kielimalleja ei ole sellaisenaan järkevää käyttää aikasarjaennustamisessa”, arvioi Ojapalo. “Sen sijaan hyötyä voidaan saada kielimallien taustalla käytetystä arkkitehtuurista, kuten transformerista. Aikasarjaennustamista varten on olemassa suorituskykyisiä esikoulutettuja malleja, kuten Amazon Chronos, jotka on koulutettu pelkästään numeerisella datalla. Mallista voidaan näin pudottaa miljardeja tarpeettomia parametreja, mutta samalla säilytetään kaikki kielimallin hyvät ominaisuudet.”

”Tätä voisi kuvata myös niin, että varastojärjestelmän ohjaukseen ei tarvita ydinfyysikon logiikkaa – vaan varastotyöntekijän logiikka”, Joona Ojapalo kuvaa. ”Nykyinen suuntaus tuntuu olevan, että jokaisesta kielimallista yritetään kehittää superäly, joka ratkaisee kaikki maailman ongelmat. Eihän siinä ole järkeä.”

Ojapalon tarkoittama puhtaaseen aikasarjadataan perustuva varastotyöntekijämalli ymmärtää jo lähtökohtaisesti toimialakohtaisia piirteitä, kuten vähittäiskaupan kausivaihtelua, teollisuuden tuotantosyklejä tai vaikkapa sähkömarkkinoiden dynamiikkaa varaston lämmön- ja kylmänsäätelyn ohjaukseen. On helppo nähdä, että malli voisi tuottaa luotettavia ennusteita ja käytännöllisiä suosituksia juuri sille ominaisen liiketoiminnan kehittämiseen.

Välineitä tuotantolaitosten huoltotarpeen ennustamiseen

Konkreettinen ja erittäin hyödyllinen käyttökohde aikasarjaennustamiseen löytyy teollisuuden puolelta. Kun tuotantolaitos pysähtyy yllättäen ilmenneen huoltotarpeen vuoksi, puhutaan helposti miljoonien menetyksistä. Jos kyseessä on kriittiseen infraan, esimerkiksi energiantuotantoon kytkeytyvä laitos, menetykset ja haitat ovat heijastusvaikutuksineen moninkertaisia.

”Tuotantolaitoksissa kerätään dataa valtavasti erilaisilla sensoreilla, kameroilla ja myös käsisyöttönä. Jos laitoksella olisi käytössään sille räätälöity aikasarjaennustamisen työkalu, joka lukisi kaikkea laitoksessa tuotettua dataa, voitaisiin saada jo ennakkoon tietoa tulevasta huoltotarpeesta. Tai mistä tahansa muusta laitoksen toimintaan vaikuttavasta tekijästä”, arvioi Ojapalo. ”Näen tässä valtavan kiehtovan potentiaalin.”

Uusi paradigma liiketoiminnan ennustamiseen?

Räätälöity ja erikoistunut pieni kielimalli voi yksinkertaistaa aikasarjaennustamista merkittävästi, erityisesti vähentämällä datan prosessointiin kuluvaa aikaa. Kun aikasarjaennusteet yhdistetään muihin älykkäisiin järjestelmiin ja komponentteihin, käyttäjälle voidaan tarjota paitsi numeerisia ennusteita, myös selkeitä selityksiä ja toimenpidesuosituksia.

”Pidän tätä täysin mahdollisena. Aikasarjaennustaminen voidaan tuoda myös sellaisten organisaatioiden ulottuville, joilla ei ole resursseja palkata datatieteilijöitä tai maksaa kalliista pilvipalveluista”, Ojapalo arvioi. ”Pienten mallien käyttöönotto tässä kontekstissa tarkoittaisi paradigmanmuutosta siinä, miten organisaatiot hyödyntävät dataa strategisessa suunnittelussa. Aikasarjaennustamisesta voisi tulla arkipäiväinen työkalu, joka parantaisi päätöksentekoa ja ohjausta kaikenkokoisissa yrityksissä ja organisaatioissa.”



Lisää luettavaa aiheesta:

Gruver, N., Finzi, M., Qiu, S. and Wilson, A.G., 2023. Large language models are zero-shot time series forecasters. Advances in Neural Information Processing Systems, 36, pp.19622-19635. URL: https://arxiv.org/abs/2310.07820

Ansari, A.F., Stella, L., Turkmen, C., Zhang, X., Mercado, P., Shen, H., Shchur, O., Rangapuram, S.S., Arango, S.P., Kapoor, S. and Zschiegner, J., 2024. Chronos: Learning the language of time series. arXiv preprint arXiv:2403.07815. URL: https://arxiv.org/abs/2403.07815


Artikkeli on kirjoitettu yhteistyössä Asteroidin kumppanin kanssa.

 
Next
Next

Meet the Asteroidians: Kai Lindgren, vanhempi ohjelmistokehittäjä, IT-alalla vuodesta 2006