a) Tehtävänäsi on arvioida sanoja ``tuntumaan jo'' seuraavan sanan todennäköisyydet. Mahdollisia jatkosanoja ovat
Vertaa antamiasi estimaatteja kielioppiaineistosta laskettuihin (tasoittamattomiin) estimaatteihin. Kumpi antoi paremman todennäköisyyden oikealle sanalle?
b) Tiedät koko lauseen alun, joka on ``Leuto sää ja soidinmenonsa aloittaneet tiaiset ovat saaneet helmikuun tuntumaan jo X''. Arvioi nyt tämän kontekstin perusteella uudestaan annettujen sanojen todennäköisyydet.
c) Mitä erilaisia tietoja kielioppimalli tarvitsisi, jotta se pystyisi vastaamaan ihmisen suorituskykyyn b)-kohdassa?
Alkuperäisessä lauseessa ollut sana löytyy paperin kääntöpuolelta.
Laske siis tällä kertaa interpoloidun bigrammimallin antamat todennäköisyydet edellisen tehtävän esimerkkihistorioille. Käytä bigrammien tasoituksena absoluuttista vähennystä (absolute discounting) parametrilla .
Perääntyvän (back-off) kielimallin todennäköisyydet voidaan laskea seuraavasti: