next up previous contents
Next: Itseorganisoituva kartta (SOM) Up: Analyysimenetelmä Previous: Analyysimenetelmä

Neuraalilaskenta ja keinotekoiset neuroverkot

  Itseorganisoituva kartta (Self-Organizing Map, SOM) on neuraalilaskentamenetelmä. Neuraalilaskentamenetelmien suosio on kasvussa teknisissä ongelmissa, joista on tarjolla paljon dataa, mutta joiden analyyttinen käsittely on vaikeaa [6]. Neuraalilaskentamenetelmiä toteutetaan keinotekoisilla hermoverkoilla eli neuroverkoilla. Keinotekoisen hermoverkon määritelmäksi esitetään professori T. Kohosen itseorganisoituvia karttoja käsittelevässä perusteoksessa [23, sanasto, käännös omani]:

Keinotekoinen hermoverkko on massiivisesti rinnakkainen yksinkertaisten (yleensä sopeutuvien) elementtien ja niiden hierarkkisten kokonaisuuksien verkko. Verkon tarkoituksena on olla vuorovaikutuksessa reaalimaailman objektien kanssa biologisten hermojärjestelmien tapaan. Yleisemmin keinotekoiset hermoverkot muodostavat abstrakteja skeemoja -- kuten matemaattisia estimaattoreita ja symbolisia säännöstöjä -- esimerkkien avulla ilman heuristista suunnittelua tai muuta ihmisen ohjausta. Skeeman tarkoituksena on kuvata biologisen tai keinotekoisen hermoverkon toimintaa hyvin ideaalisella tasolla ja määritellä tiettyjä suorituskyvyn rajoja.

Neuraalilaskentamenetelmissä käytetään rinnakkaisia yksinkertaisia laskentaelementtejä suorittamaan suuria laskentaoperaatioita. Laskentaelementtejä kutsutaan monissa menetelmissä neuroneiksi ja koko järjestelmää (keinotekoiseksi) neuroverkoksi. Neuraalilaskennassa ei pyritä heuristisesti ohjelmoimaan toimintoja, vaan annetaan järjestelmän itse sovittautua opetusjoukossa esiintyviin säännönmukaisuuksiin, toisin sanoen oppia ja yleistää.

Nimensä mukaisesti monet neuraalilaskentamenetelmät ovat alunperin saaneet innoituksensa biologisen hermoston toiminnasta. Perusesimerkkinä neuraalilaskentamentelmästä on useissa teoksissa monikerrosperseptroni (Multi Layered Perceptron, MLP), jonka laskentaelementti, perseptroni (Rosenblatt 1957), on samankaltainen kuin yksinkertainen McCulloch-Pitts-neuronimalli (1943)[36]. Neuraalilaskennan laajaan perheeseen luetaan myös menetelmiä, joiden yhteys biologiseen hermostoon ja oppimiseen on etäinen [34, luku 5].

Sanat neuraalilaskenta ja oppiminen tuovat helposti mieleen inhimilliseen oppimiseen arkiajattelussa liitettäviä käsitteitä. Keinotekoiset neuroverkot ovat kuitenkin lähinnä matemaattisia olioita. Oppiminen on verkon laskentaelementtien ja niiden välisten yhteyksien parametrien muuttumista verkolle syötetyn datan perusteella. Parametrien muuttaminen tapahtuu yleensä jollakin iteratiivisella algoritmilla.

Kohonen toteaa, että neuraalimallien tarkoitus ei ole jäljitellä fysiologiaa, vaan toteuttaa informaationkäsittelyprosesseja. Esimerkiksi itseorganisoituvan kartan kuvallinen esitys -- karttayksiköistä rakennettu verkko -- ei ehkä ensinäkemältä muistuta hermokudosta, mutta on olemassa vakuuttavia todisteita toiminnallisesta samankaltaisuudesta. Itseorganisoituvan kartan toiminta siis muistuttaa jollakin tasolla aivoissa tapahtuvaa informaation käsittelyä. Muun muassa kuuloaivokuorella voidaan todeta äänihavaintoa prosessoivien hermosolujen spatiaalisen järjestyksen vastaavan äänen taajuutta [23, sivut 71-75].

Neuroverkkoja jaotellaan eri kriteerein. Yksi jako on ohjattu oppiminen -- ohjaamaton oppiminen (esim. [36, sivut 22-23]):

Ohjatusti opetettu
verkko oppii muodostamaan kuvauksen syötteistä tunnettuihin vasteisiin. Monikerrosperseptroni on perusesimerkki tällaisesta verkosta. Oppiminen tarkoittaa MLP-algoritmissa sitä, että verkon elementit minimoivat iteratiivisesti sakkofunktion, joka on verkon vasteen ja kuhunkin syötteeseen liittyvän halutun vasteen (''oikean vastauksen'') eron funktio. Minimointikeino on jonkin optimointimenetelmän, esimerkiksi gradienttimenetelmän, toteutus ko. verkolla. MLP-verkko siis itse asiassa approksimoi funktion syöteavaruudesta vasteavaruuteen eli tekee signaalimuunnoksen.
Ohjaamattomasti opetettu
verkko sovittautuu dataan jonkin tarkoituksenmukaisen kriteerin mukaan. Opetusjoukon vasteita ei määrätä, vaan ne ovat oppimisprosessin tuloksia. Itseorganisoituva kartta kuuluu ohjaamattomasti opetettujen neuroverkkojen ryhmään. Itseorganisoituvan kartan vaste syötteelle voidaan määritellä voittajayksiköksi (ks. luku 2.2.4).

Toisenlainen jako luokittelee neuroverkot signaalimuunnokseen, tilansiirtoon tai kilpailuoppimiseen perustuviksi [23, sivut 60-61]. Tässä jaottelussa MLP-verkko kuuluu siis signaalimuunnosverkkoihin ja itseorganisoituva kartta kilpailuoppimiseen perustuviin verkkoihin. Kilpailuoppimisessa kaikki verkon yksiköt saavat saman syötteen; ne kilpailevat vasteen muodostamisesta keskenään.

Neuraalilaskentamenetelmillä on saavutettu hyviä tuloksia analyyttisesti vaikeissakin ongelmissa. Esimerkkejä löytyy alueilta, joilla ei tunneta analyyttisiä malleja, niiden muodostaminen on vaikeaa, näyteaineisto on kohinaista ja korkeaulotteista tai vaaditaan sopeutumiskykyistä järjestelmää. Hahmontunnistukseen, aikasarjaennustukseen, säätötekniikkaan, klusterointiin ja luokitteluun liittyvät tehtävät ovat suuria sovellusalueita.

Neuraalimalleihin liittyy musta laatikko -ajattelu niin hyvässä kuin pahassakin; neuroverkkoon perustuvalla menetelmällä on mahdollista saada esimerkiksi säätöjärjestelmä toimimaan, vaikka analyyttistä mallia ei tunnettaisikaan. Neuroverkkojen rinnakkaisuus ja oppimiseen perustuva mallinnus tekevät neuroverkoista virhesietoisia ja adaptiivisia malleja. Useimmat neuroverkot kykenevät mallintamaan myös epälineaarisia järjestelmiä.

Toisaalta neuroverkkojen käyttäminen ei välttämättä lisää ymmärtämystä järjestelmästä, ja sen toiminta on siten ennakoimatonta, eikä virhetilanteita ole helppo ennustaa. Neuroverkkomallinnus on useimmiten täysin syötedatan varassa mallintaessaan ilmiötä, joten datan suuri määrä, laatu ja edustavuus ovat keskeisiä seikkoja. Monesti on hankalaa saada riittävä määrä dataa, ja usein esimerkiksi tiettyä virhetoimintaa edustavan aineiston saanti voi olla mahdotonta. Neuraalilaskentaa onkin kuvattu musta laatikko -termin lisäksi sanaparilla datarikas -- teoriaköyhä [9].

Neuroverkon opetus on usein aikaavievää. Yleensä neuroverkko toteutetaan tavallisessa yhden suorittimen tietokoneessa ohjelmallisesti, jolloin rinnakkaisuudesta ei ole hyotyä. Tietokoneiden suorituskyky on kuitenkin kasvanut niin paljon, ettei neuraalilaskennan vaatima kapasiteetti ole enää samanlainen ongelma kuin menneinä vuosikymmeninä.

On olemassa erityisesti neuraalilaskennan tarpeisiin kehitettyjä piirejä, kiihdytinkortteja ja tietokoneita, joilla päästään hyödyntämään yksinkertaisten operaatioiden rinnakkaisuutta [6, sivut 91-95]. Myös erityisiä SOM-laitteistototeutuksia on olemassa [23, sivut 215-230].


next up previous contents
Next: Itseorganisoituva kartta (SOM) Up: Analyysimenetelmä Previous: Analyysimenetelmä
Johan Himberg
12/11/1997