Opetusparametrivalintojen vaikutus

Next: Datan esikäsittely Up: Virhemittoja Previous: Virhemittoja

Opetusparametrivalintojen vaikutus

Opetuksen tavoitteena on saada kartta järjestymään ja kvantisointivirhe mahdollisimman pieneksi. Nämä voivat olla ristiriitaisia tavoitteita, sillä useimmiten kartan dimensio on pienempi kuin datan. Kuten edellä todettiin, kartta laskostuu pyrkiessään kvantisoimaan korkeampiulotteista avaruutta. Jos karttahilan dimensio olisi sama kuin opetusdatan luonnollinen dimensio, saavutettaisiin hyvä oppimistulos. Kartta on kuitenkin useimmiten tarkoitus visualisoida, jolloin kolmea korkeampi hilan dimensio vaikuttaa utopistiselta ihmisen käsityskyvylle ja kaksi lienee luontevin ratkaisu.

Kartan järjestymiseen voidaan vaikuttaa opetusparametrien oikealla valinnalla. Yleinen käytännön menetelmä on opettaa kartta ensin laajalla naapurustolla -- naapurustofunktion h parametri $\sigma$ on suuri suhteessa kartan tilavuuteen. Tällöin kartta on jäykkä ja saadaan järjestymään globaalisti. Tämä opetusvaihe on tyypillisesti muutaman epokin mittainen. Seuraavasssa vaiheessa opetus aloitetaan pienemmällä naapurustolla ja opetusparametrin alkuarvolla, jolloin kvantisointivirhe pienenee, mutta kartta ei toivottavasti enää pääse globaalisti epäjärjestymään.

Kohosen perusteoksessa [23, sivu 80] mainitaan peukalosäännöiksi tuhannen opetusaskeleen luokkaa oleva ensimmäinen, karkean opetuksen vaihe, jonka aikana naapuruston säde voi olla aluksi yli puolet kartan halkaisijasta pienentyen yhteen yksikköön ja oppimisnopeuskertoimen $\alpha$ alkuarvo on lähellä yhtä. Toisessa vaiheessa naapurusto voi olla alun alkaen pieni ja $\alpha$ :n alkuarvo luokkaa 0.02. Jos kartta on alustettu lineaarisesti, voi karkean opetusvaiheen jättää pois [23, sivu 107]. Kuvassa 2.2 on esitetty naapuruston koon vaikutus lineaarisen alustuksen jälkeisessä yksivaiheisessa opetuksessa.

Oppimisnopeuskerroin- ja naapurustofunktion muodot eivät ilmeisesti ole erityisen kriittisiä parametrivalintoja. On kuitenkin olemassa tuloksia, joilla voi perustella joidenkin valintojen paremmuutta. Lähteen [7] perusteella konveksi naapurustofunktio on suotuisampi kartan järjestymiselle kuin konkaavi. Toinen tulos on, että oppimisnopeuskertoimen ( $\alpha$ ) arvon tulisi vähetä kaavan 2.3 tyyppisesti, jotta kaikki opetusjoukon näytteet vaikuttaisivat yhtä paljon [30]. Kartan hilassa tulisi käyttää kuusikulmionaapurustoa, jolloin kartan visualisointi ei suosi pysty- ja vaakasuoria suuntia siinä määrin kuin neliönaapurusto [23, sivu 112].

Itseorganisoituvan kartan teoreettinen analyysi on osoittautunut vaikeaksi, ja monet mm. kartan konvergoitumiseen liittyvät kysymykset ovat vielä avoimia [4,23]. Kartta-algoritmi on kuitenkin käytännössä osoittautunut harvinaisen robustiksi (vankaksi) parametrivalintojen suhteen. Käytännön tehtävissä datan skaalaus, kohina ja tarkasteltavien parametrien valinta alun alkaen ovat ilmeisesti enemmän huomiota vaativia ongelmia kuin kartan opetusrutiinin äärimmäinen hiominen.

Next: Datan esikäsittely Up: Virhemittoja Previous: Virhemittoja

Johan Himberg
12/11/1997