Yksinkertaisin mittari kartan erottelukyvyn mittaamiseksi on
keskimääräinen kvantisointivirhe :
![]() |
(8) |
Kahden kartan vertaaminen toisiinsa kvantisointivirheen avulla ei ole aina järkevää, sillä suuremmalla kartalla voidaan tietysti kvantisoida opetusjoukko tarkemmin. Samoin on ilmeistä, että pienempi naapuruston säde opetuksessa tuottaa usein tarkemman kvantisoinnin, sillä mallivektorit voivat liikkua toisistaan suuremmin välittämättä. Vasta samankokoisten ja samalla naapurustofunktiolla opetettujen karttojen vertailu on mielekästä [24].
Data on yleensä korkeampiulotteista kuin kartan hilarakenne, siis
. Kartta pyrkii tällöin mallintamaan
datajoukkoa laskostumalla kuten kuvassa 2.2.
Kartan laskostumattomuuden eli kuvauksen jatkuvuuden merkitys
on tärkeä esimerkiksi visualisoinnin kannalta: repaleinen kuvaus ei
kerro kartan tulkitsijalle selkeästi näytteiden keskinäisistä
suhteista, ja virhetulkintojen mahdollisuus kasvaa. Kuvauksen
jatkuvuutta kuvataan topografisella virheellä .
Tämän työn yhdessä aihepiirissä, prosessien monitoroinnissa,
on topografinen virhe todettu tärkeäksi ongelmaksi [19].
Esimerkkinä tarkastellaan kahta kaksiulotteista karttaa, jotka on opetettu samalla yksikkökuutioon tasan jakautuneella pseudosatunnaisdatalla. Molemmat kartat on alustettu samoin (kuva 2.2(a)). Kartta kuvassa 2.2(b) on järjestynyt. Se täyttää kartan topologian säilyttävän ominaisuuden paremmin kuin kuvan 2.2(c) kartta, mutta sen kvantisointivirhe jää suuremmaksi. Jälkimmäinen kartta on puolestaan voimakkaammin laskostunut, jolloin lähellä toisiaan olevat datavektorit kuvautuvat useammin hilassa toisistaan kaukana oleviin karttayksiköihin.
Topografisia virhemittoja on ehdotettu useita. Yhteenvetoja löytyy
esimerkiksi lähteistä [18,41]. Yksinkertainen topografinen
virhemitta on Kiviluodon esittämä [20]. Lasketaan
kullekin datavektorille kaksi lähintä yksikköä
ja
. Lasketaan kuinka monen datavektorin
voittajayksikköparit
ja
eivät ole toistensa
välittömiä naapureita hilassa. Virhemitta on tämän määrän suhde
datavektorien määrään, siis:
![]() |
(9) |
Yksinkertaisuuden lisäksi tämän mitan etu on erilaisten karttojen ja datajoukkojen virheitten vertailukelpoisuus [42], koska karttojen koko, datan määrä ja muut parametrit eivät selvästikään vaikuta tämän virhemitan skaalaan.
![]() |
Kaski ja Lagus ovat ehdottaneet yhdistettyä mittaa, topografista
kvantisointivirhettä , jossa erottelykyvyn ja
jatkuvuuden mitat yhdistetään [18]. Mitta on summa kahdesta
etäisyydestä: Lasketaan syötevektorin etäisyys voittajayksikköön
, siis kvantisointivirhe. Tähän lisätään lyhin mahdollinen
etäisyys
niistä etäisyyksistä, jotka
saadaan
ja
välille aina vierekkäisestä
yksiköstä toiseen kulkien. Kartan yhdistetty virhe datajoukon suhteen
on datajoukon vektoreiden virheiden keskiarvo. Toisin sanoen
(viitteen [41] merkintätapaa mukaellen)
![]() |
(10) |
jossa k korvataan k':lla jokaisen summausaskeleen jälkeen. Nk,1 tarkoittaa yksikön lähimpiä naapureita hilassa.