next up previous contents
Next: Tarkasteltavien muuttujien valinta Up: Prosessin analysointia kartan avulla Previous: ACD-datan keruu ja datan

Esikäsittely Matlabissa

Matlabissa dataa korjattiin siten, että raportointivälillä, jolla oli saapuneita puheluja, mutta puuttuva odotusaika, korvattiin puuttuva aika nollalla. Puuttuvia arvoja ei tarvinnnut tutkia erikseen: laskenta-algoritmit oli laadittu siten, että puuttuvat komponentit eivät aiheuta ongelmia.

Dataa oli käytössä kahdelta eri ajalta: vanhempi 108 päivää käsittävä sarja ja muutamaa kuukautta uudempi 33 päivän sarja. Kaikista päivistä oli 114 viiden minuutin aikavälin näytettä.

Aluksi tarkastelin vanhempaa, suurempaa datajoukkoa. Keskiarvoistin dataa laskemalla jokaiselle parametrille tunnin keskiarvon tai tuntisumman parametrin laadusta riippuen[*].

Keskiarvoistamisella oli kaksi perustetta. Viiden minuutin aikana puheluita tulee usein vain muutama. Tällöin tutkittavat järjestelmän parametrit määritetään vähäisestä datamäärästä. Tunnin aikana dataa ehtii kertyä enemmän, jolloin erilaisten aikakeskiarvojen ja vastausprosenttien laskemiseksi on enemmän dataa. Tähän tarkoitukseen kelpaisi myös liukuva keskiarvo, mutta halusin myös vähentää datan määrää, jotta kartan opettaminen SOM Toolboxilla olisi nopeampaa.



Johan Himberg
12/11/1997