next up previous contents
Next: Esikäsittely Matlabissa Up: Konttoreiden jaottelu soittojen aiheiden Previous: Konttoreiden jaottelu soittojen aiheiden

Datan kerääminen ja siirto Matlabiin

Dataa oli saatavilla kolmesta palvelusta, joista valitsin yhden kokeilua varten. Valintaperuste oli lähinnä se, että kysymysten jako oli tässä palvelussa vain yksiportainen ja siten selkeästi hahmotettavissa. Käytössä oli tiedot 7104 kysymyksestä kahden kuukauden ajalta. Kysyneitä konttoreita oli 717. Erilaisia kysymyksen aiheita löytyi tiedostosta 35.

Data tulostettiin aluksi tekstitiedostoksi. Tiedostosta leikattiin kentät, joissa oli kerrottu kysymyksen esittäneen konttorin nimi ja kysymyksen aihe. Kysymyksen aihe ja konttorin nimi oli esitetty tekstinä, joten nämä oli vielä muutettava matriisiksi numerokoodeja. Tämä tehtiin Matlabin ulkopuolella, ja matriisi oli sitten siirrettävissä suoraan Matlabiin. Sen lisäksi Matlabiin siirrettiin tiedosto, jossa oli kysymyksien aiheet ja konttoreiden nimet selväkielisinä visualisointia varten. Tämä vaihe oli varsin pitkäpiimäinen ja osaksi manuaalinen. Todellisessa sovelluksessa tehtäisiin tietysti automaattinen dataformaatin muunnin.



Johan Himberg
12/11/1997