Sentimentanalyse
I sentimentanalyse skal vi finne ut om teksten er positiv eller negativ. Det kan være en omtale, en twittermelding eller en setning vi analyserer, men spørsmålet er om den tekstbiten vi ser på, er positiv eller negativ. En klassisk øvelse er å finne ut om filmomtaler er positive eller negative. Se for eksempel her eller her. Sentimentanalyse brukes for å analysere kundeomtaler, og twittermeldinger for å spore endringer i populariteten til produkter eller merkevarer. Noen firmaer kjører sentimentanalyse på chatteloggen til kundeservice for å måle tilfredshet og følelsesnivå gjennom en dialog over chat, og man kan bygge det inn i chatteboter for at boten kan tilpasse svaret sitt til følelsene som brukeren uttrykker.
Sentimentanalyse på norsk
På norsk har vi NoReC, Norwegian Review Corpus, der over 35 tusen omtaler er samlet. Alle omtalene har et “terningkast”, et tall fra en til seks som angir hvor positiv forfatteren er til det som blir omtalt. Med disse dataene kan man gjøre tilsvarende øvinger som med imdb-dataene, og lage tekstklassifisering som prøver å finne ut om en omtale er positiv eller negativ, eventuelt hvor positiv eller negativ omtalen er.