SENTIMENTI - analizator emocji w słowie pisanym

Celem projektu B+R jest stworzenie oprogramowania SENTIMENTI umożliwiającego analizę treści pisanych, w szczególności internetowych, pod kątem emocji i wydźwięku emocjonalnego.

Oprogramowanie, jako pierwsze w języku polskim, zostanie zaprojektowane w oparciu o jeden z teoretycznych modeli, zakładający istnienie kilku odrębnych kulturowo uniwersalnych i biologicznie uwarunkowanych emocji, tj. MODEL EKMANA (wiążący emocje z ekspresją mimiczną), MODEL EMOCJI PLUTCHIKA (pozwalający na uchwycenie zarówno intensywności emocji oraz stopnia ich podobieństwa) bądź MODEL GENEVA EMOTION WHEEL (zakładający podejście wymiarów emotywnych poprzez umieszczenie poszczególnych grup emocji w przestrzeni znaku emocji i kontroli oraz posiadający pięciostopniową skalę intensywności emocji).

Oparcie technologii na wskazanych modelach pozwoli na scharakteryzowanie wypowiedzi pod względem oceny polaryzacji wydźwięku i podstawowych emocji – w odróżnieniu do obecnych rozwiązań, oferujących wyłączanie polaryzację wydźwięku jako negatywną, pozytywną lub neutralną. Opisy tego typu mają szerokie zastosowanie w monitoringu mediów, analityce, marketingu oraz komunikatorów internetowych. Ponadto, nowa technologia pozwoli na integrację z systemami użytkowników zainteresowanych analizą treści (np. social media) oraz umożliwi przetwarzanie treści pisanych na portalach, czatach, forach dokonując analizy rozpoznającej wyrażane w nich emocje oraz polaryzację wydźwięku, w formie raportów natężenia emocjonalnego badanej treści.

Zaimplementowane w oprogramowaniu algorytmy będą uwzględniały kontekst wystąpienia użytych słów i fraz w oparciu o rozbudowane, efektywne gramatyki analizy lokalnej oparte na metodach inżynierii języka naturalnego. Oprogramowanie pozwoli na łatwe, półautomatyczne dostrajanie go metodami maszynowego uczenia się do wybranych zbiorów dziedzin tematycznych w celu osiągnięcia maksymalnej jakości działania.