next up previous contents
Next: Osumat ja trajektorit Up: Visualisointi Previous: U-matriisi

Sammonin kuvaus

Sammonin kuvaus [29] on iteratiivinen algoritmi, jolla n-ulotteinen datajoukko voidaan kuvata k-ulotteiseksi (n>k) siten, että datapisteiden väliset parittaiset suhteelliset keskinäiset etäisyydet ovat mahdollisimman lähellä alkuperäisiä. Yleensä projektio tehdään visualisointia varten kaksiulotteiseen tasoon (k=2), jolloin projektio voidaan piirtää paperille tai näytölle. Tällä tavalla voidaan tutkia niin opetusdataa kuin karttaakin.

Datajoukon poikkeavat arvot, jotka voivat haitata opetusta, voidaan tunnistaa ja mahdollisesti poistaa, ja datajoukon muodon kaksiulotteinen projektio antaa viitteitä kartan muodon valintaan.

Karttayksiköiden yhteydet voidaan kuvata viivoilla, jolloin projektion avulla voidaan todeta kartan järjestymisen yleisilme: huonosti järjestynyt kartta on kiertynyt ja sekava, kun taas hyvin järjestyneen kartan kuvaus on selkeä.

Kuvassa 2.3(c) on kuvan 2.3(b) kartan Sammonin kuvaus tasoon. Kuvauksesta on tietysti todellisuudessa hyötyä vasta kun data on yli kolmiulotteista. Kuvasta voi todeta, että Sammonin kuvaus on samalla tavalla kiertynyt kuin alkuperäinen karttahila.

Sammonin kuvaus on u-matriisia parempi kuvaamaan mallivektoreiden keskinäistä sijaintia data-avaruudessa, mutta se on laskennallisesti raskas operaatio. U-matriisi on puolestaan suoraviivainen ja nopea laskettava, ja se vertautuu suoraan komponenttitasoihin.



Johan Himberg
12/11/1997