Tutkimusalani korpuslingvistiikka tutkii kielenkäyttöä laajoissa, konelukuisissa aineistoissa. Omassa tutkimuksessani olen keskittynyt erityisesti internetissä käytettävään kieleen ja internetistä koneellisesti koottujen kieliaineistojen kehittämiseen. Internetin tietovarannot tarjoavat valtavasti mahdollisuuksia monille tieteenaloille. Esimerkiksi edistyneet konekäännösohjelmat toimivat yhä paremmin, ja ihmisten vuorovaikutusta, kansanryhmien mielipiteiden syntyä ja koko globaalistuneen maailman liikehdintää pystytään tarkastelemaan aivan uudella tavalla. Internetin valtavaa potentiaalia rajoittaa kuitenkin, paradoksaalisesti, sen koko. Siksi kehitämme menetelmiä, joilla kieltä voidaan analysoida koneellisesti yhä paremmin.
Olen toiminut vuodesta 2018 digitaalisen kielentutkimuksen apulaisprofessorina Turun yliopiston Kieli- ja käännöstieteiden laitoksella. Tutkimusryhmämme hankkeita ovat esimerkiksi Suomenkielinen internet kieliaineistoksi (Koneen säätiö) ja Uutinen, mielipide vai jotain muuta? Erilaiset tekstit ja niiden automaattinen tunnistus monikielisestä internetistä (Emil Aaltosen säätiö).