A gördülékenyebb és eredményesebb ember-számítógép interakcióhoz fontos tudni, hogy milyen típusú kapcsolatok alakíthatók ki az interakció résztvevői között. Érzékelhetik-e, megérthetik-e valamikor érzelmeinket a gépek, és ha igen, hogyan reagálnak rájuk, és miként hasznosíthatjuk az eredményeket? Egyre többen gondolják, hogy a válasz pozitív, viszont cseppet sem úgy, mint a sci-fikben olvassuk és látjuk. Egyrészt már fejlesztenek a felhasználó érzelmeit felismerő, értelmező és befolyásoló, azokra intelligens módon reagáló programokat, virtuális asszisztenseket, másrészt az érzelmek érzékelése nem azonos tudatosításukkal, átélésükkel.
Érzelmi számítások (affective computing) az 1990-es évek második felében indult szakterület neve, leghíresebb képviselője az MIT Médialaboratóriumának Affektív Számítások Kutatócsoportját vezető Rosalind Picard.
Emberközpontú számítógépek
Picard és munkatársai nem tudják a választ a fenti kérdésekre, ráadásul a témakör kapcsán sci-fi világok vizionálóit is kijózanítják: éles különbséget tesznek affektív jelzéseket érzékelő, illetve interpretáló, vagy – távoli lehetőségként – mutató gépek között. Hiába tanítjuk meg nekik például, hogy felismerjék, beazonosítsák a rettegést, attól még minimálisan sem rettegnek.
Az emóció az emberi létezés meghatározó részeként kognitív tevékenységeinket, az érzékelést és az olyan mindennapi feladatokat, mint a kommunikáció, a tanulás vagy a racionális döntéshozás egyaránt befolyásolja. Az infokommunikációs technológiák tervezésekor viszont sokáig nem vették figyelembe – például azért, mert gyakran félreérthető, és nehéz számszerűsíteni, mérni.
Picard eleinte a jelfeldolgozás számítógépekre történő, azok hatékonyabb „gondolkodását” célzó alkalmazásával foglalkozott. Az agy (érzelmekért felelős, hang-, kép-, szagminták felismerésében fontos szerepet játszó) limbikus rendszereit tanulmányozva ismerte meg Antonio Damasio munkáit. 1994-es, Descartes tévedése (Descartes’ Error) című könyvében az idegtudós amellett érvelt, hogy – a limbikus rendszerek és a homloklebeny „összjátékaként” – következtető/döntéshozó készségünk részben emocionális indíttatású, mivel képesek vagyunk megélni érzelmeinket.
Picard az intelligenciateszteken kiemelkedő eredményt elérő, ám érzelmileg teljesen közömbös agykárosultak és a szabály-alapú mesterségesintelligencia-rendszerek hibái közötti párhuzamból kiindulva jutott el a legtöbb szakmabeli nézetével merően ellentétes felismerésig: az emocionális oldal nem mellékhatás, hanem – kognitív tevékenység és érzelmek egyensúlyi állapotát fenntartva, kialakítva – figyelembe kell venni számítógépek tervezésekor. A merész célok kivitelezésére egyetemi kutatócsoportot és egy ipari konzorciumot („Gondolkodó Tárgyak”, Things That Think) szervezett; fejlesztéseik, „emberközpontú” gépeik rendeltetése nemcsak a számítógép és a felhasználó interakciója során gyakran tapasztalt frusztráció csökkentése, vagy a még erőteljesebben felhasználóbarát informatika, hanem az alapvető érzelmi mechanizmusok jobb megértése is.
Segítő ágensek
Interdiszciplináris kutatásaik többek között a következő diszciplínákat érintik: számítástudomány, játéktervezés, kognitív és idegtudományok, szociológia, oktatás, fiziológia, pszichológia, etika… Működésük számos területen érezteti hatását. Például új módokat – magunkon viselhető szenzorokat, az információ multimodális csatornáit elemző gépitanulás-algoritmusokat – találtak ki a felhasználó affektív-kognitív állapotának kommunikálására. A frusztrációt, stresszt és más lelkiállapotokat közvetetten, természetes interakción és beszélgetésen keresztül feltérképező technikákat szintén kidolgoztak. Többször demonstrálták, hogy a számítógépek képesek a felhasználó frusztrációjára a negatív érzéseket csökkentő módon reagálni. Egyes személyre szabott technológiáik érzelmi állapotok egészségre gyakorolt hatását vizsgálják, míg néhány elméleti munkában az affektív számítások etikai következményeit is elemzik.
Egyik ágensük például a tanulásban segédkezik: valós időben érzékeli a felhasználó több nem-verbális érzelmi jelzését, reagál rájuk. Ha a tanuló hibát követ el, a rendszer meg tudja állapítani, hogy frusztrált, és pillanatnyilag fel akarja adni, vagy folytatná a munkát. Három „érzelempalackjuk” az ember lehetséges emocionális állapotaiból hármat, a dühöt, a boldogságot és a szomorúságot reprezentálja. Emocionális DJ-jük fényképeken és videókon látható arckifejezéseket alakít át. Az érzelemdetektáló Q szenzor hirdetések hatékonyságát méri.
Az érzelmi számítások eredményeit általában figyelembe veszik a felhasználóval beszélgető animált fejek, a népszerű chatbotok tervezésekor is. Elsősorban oktató, szórakoztató, vagy az adott honlapról információt szolgáltató feladatkörökben alkalmazzák őket. A beszédnek elvileg nemcsak a jelentését (szemantikáját), hanem érzelmi töltéseit is meg kell érteniük. Egyelőre roppant mulatságos, ahogy kifejezésre juttatják nemtetszésüket, vagy éppen az elégedettségüket.
A kutatók többsége általában az arckifejezés-felismerés úttörője, Paul Ekman amerikai pszichológus 1972-es hatos csoportosításából (düh, undor, szomorúság, boldogság, meglepetés, félelem) indul ki, amit az ehhez kapcsolható emotikonok által is így-úgy befolyásolt – az érzelmek széles skáláját, árnyalataikat (egyelőre) durván leegyszerűsítő – fejlesztések egyértelműsítenek.
EML
Az affective computing jelentőségét jól szemlélteti, hogy a „világháló atyja”, Sir Tim Berners-Lee nevével fémjelzett WWW Konzorcium (W3C) multimodális interakcióval foglalkozó csoportja évek óta érzelmi állapotok formalizálására alkalmas specifikáción, az EML (Emotional Markup Language, EmotionML) nyelven dolgozik. Abból indultak ki, hogy a jövő számítógépeinek a felhasználó számára is természetesnek tűnve kell kommunikálniuk. Munkájuk előrelépés a szakterület más törekvéseihez képest: figyelembe veszik az eddigi megközelítések hibáit, leegyszerűsítés, alapérzelmek, lehetséges állapotok helyett szélesebb skálában, állapotokat kombináló sorozatokban, árnyalatokban, érzelmi állapotok mellett „érzelemdimenziókban” is gondolkoznak: intenzitásban, aktivitásban/passzivitásban, pozitívumban/negatívumban, hatékonyságban/eredménytelenségben. Szakítottak az Ekman-féle csoportosítással, helyette egy 2007-es tanulmány árnyaltabb, elégedettségtől undorig ívelő 24-es skáláját tekintik alapnak. Mivel az érzelmi állapotokra vonatkozóan nincs konszenzus, az EML-specifikáció alapértelmezett beállítás helyett a felhasználóra bízza, milyen „érzelem-beállításokkal” dolgozik. Elvileg több területen hasznosítható: ember-ember és ember-gép interakció, hatékonyabb adatfeldolgozás, nem-verbális magatartás elemzése, „véleménybányászat”, „ambient and assisted living”, játékkarakterek tervezése, közösségi robotok, beszédszintézis stb.
Általánosan elfogadott szabvány EML azonban még nem létezik. Több oknál fogva: a releváns érzelmek számát illetően nincs konszenzus, így a fix leírókból álló véges sorok eleve kudarcra ítéltek. Az érzelmekhez kapcsolódó különböző állapotok a kontextus függvényében, alkalmazási területenként változhatnak, illetve az sem mindegy, hogy az emócióknak mikor melyik aspektusára kell összpontosítani. És persze egyáltalán nem biztos, hogy az adott leíró nyelv széles körben használható lesz.
David Barber, a Los Angeles-i Kaliforniai Egyetem kutatója szerint célszerűbb lenne, ha az érzelmi számítások hangok és arckifejezések mellett események személyekre gyakorolt emocionális hatását is vizsgálnák.
Friss kommentek