next up previous contents
Next: SOM Toolboxin vertailua muihin neurolaskennan Up: Analyysityökalu Previous: Matlab-SOM Toolbox -yhdistelmä

SOM Toolbox ja Matlab data-analyysiprosessissa

Verrataan Matlabilla ja SOM Toolboxilla työskentelyä kuvan 3.1 mukaiseen data-analyysiprosessiin:

Datan kerääminen
Oletetaan, että data on jo kerätty tietokantaan tai tiedostoon. Se on kuitenkin todennäköisesti väärässä formaatissa Matlabia ajatellen. Data on siis ensin puhdistettava siten, että jäljelle jää vain tiedosto, jonka Matlab voi lukea. Puhdistus ja dataformaatin muunnos on räätälöitävä tapauskohtaisesti, ja ne voivat vaatia runsaasti paneutumista.
Datan käsittely
Ennen kartan opettamista on dataa yleensä esikäsiteltävä.
1.
Datan esikäsittely: Esikäsittelyyn -- esimerkiksi suodatukseen ja muunnoksiin -- on Matlabissa tarjolla runsaasti työkaluja; SOM Toolboxiin on erikseen laadittu vain muutamia komponenttien skaalaukseen tarkoitettuja välineitä. Tässä osuudessa on Matlab valmiina työskentely-ympäristönä erityisen käyttökelpoinen.
2.
Datan käsittely kartan avulla: SOM Toolboxin osuus on datan jatkokäsittely ja visualisointi itseorganisoituvan kartan avulla. Matlabin ohjelmoinnin keveys ja SOM Toolboxin modulaarisuus mahdollistavat nopeiden muutosten teon, kokeilun ja jatkokehittelyn.

Visualisointi
SOM Toolboxiin on implementoitu erityisesti kartan visualisointityökaluja. Syntyviä kuvaobjekteja voidaan manipuloida edelleen myös Matlabin omilla työkaluilla. Datan visualisoimiseksi muuten kuin kartan avulla on Matlabissa paljon valmiita työkaluja. SOM Toolboxin Sammonin projektion laskentaa voi myös soveltaa koko datan visualisointiin, mutta se on hyvin hidasta suurilla datamäärillä.
Johtopäätökset
Ohjelmaa käyttävä asiantuntija tai asiantuntijaryhmä voi tulostaa visualisointeja johtopäätösten tekoa varten tai raportteihin liitettäviksi helposti, sillä Matlabin kuvaobjektin käyttöliittymästä kuvia voidaan tulostaa niin kirjoittimelle kuin tiedostoonkin PostScript-formaattiin.

SOM Toolbox sijoittuu siis kuvan 3.1 prosessissa pääasiassa akselille käsittely - visualisointi. Pullonkaulana prosessissa on datan kerääminen ja puhdistaminen Matlabille soveltuvaksi, siis datan siirto eri ympäristöjen välillä. Toinen hidaste on kartan opetus, jos dataa on paljon. Opetus voidaan kuitenkin tehdä nopeammalla SOM_PAKilla (ks. luvut 3.5.2 ja 3.6.5).


next up previous contents
Next: SOM Toolboxin vertailua muihin neurolaskennan Up: Analyysityökalu Previous: Matlab-SOM Toolbox -yhdistelmä
Johan Himberg
12/11/1997