1. Введение
Являются ли способы выражения эмоций одинаковыми для всех людей? Если кто-то, например, удивлен, увидим ли мы одно и то же выражение лица независимо от страны, где живет этот человек, его расы или культуры? Отличаются ли способы выражения эмоций с помощью мимики от вербального поведения, когда представители разных культур учат разные слова, которые обозначают одно и то же? Правда ли, что мы можем понять чувства иностранца, если будем наблюдать за выражением его лица, что нам не потребуется никакой специальной «школы иностранных языков для изучения выражений лица», чтобы мы смогли понять, что обозначают разные виды мимики в разных культурах?
Если выражения лица универсальны, значит ли это, что они являются врожденными? Может быть, обучение не играет важной роли для связи выражения лица с эмоциями, которые оно передает? Передаются ли человеку по наследству конкретные мимические движения, которые выражают гнев и удивление, грусть и так далее? Может быть, именно наши гены определяют, какие именно лицевые мышцы будут приходить в движение, когда мы будем испытывать то или иное чувство?
И если выражение эмоций с помощью мимики универсально и является врожденным, является ли оно результатом эволюции человека от его предков — представителей животного мира?
Похожи ли способы выражения эмоций человека на те, что наблюдаются у остальных приматов? Могут ли принципы, которые объясняют, отчего уголки наших губ поднимаются, а не опускаются, когда мы счастливы, так же объяснять мимику шимпанзе или волка? Проявляются ли у человека эти способы выражения эмоций потому, что он произошел от животных?
Дарвин считал, что на все эти вопросы следует ответить утвердительно. Более того, он думал, что положительный ответ на первую группу вопросов (что выражение лица является универсальным) неизбежно заставляет давать положительный ответ и на вторую группу вопросов (что они являются врожденными).
А если универсальные виды мимики врожденные, то нужно дать положительный ответ на третью группу вопросов (согласившись с тем, что они выступают результатом эволюции). Это последнее утверждение мы рассматривать не станем, так как его обсуждала в главе 2 Шевалье-Скольникофф, рассуждая о взаимосвязи выражения лица у человека с мимикой остальных приматов
Мы сконцентрируем наше внимание на первой группе вопросов (о возможном универсальном характере выражения лица). Мы убедимся, что положительный ответ на вопрос об универсальности необязательно означает, что и на вопрос о врожденном характере мимики существует утвердительный ответ, как считал Дарвин (хотя так увеличивается вероятность того, что генетика является важным фактором, обусловливающим выражение лица)
Вопрос о врожденном характере не будет нас занимать в первую очередь по причинам, которых мы вкратце коснемся.
Во времена Дарвина, как он сам сообщал, многие люди разделяли точку зрения, что разные виды выражения лица являются универсальными, даже если этому не находилось веских подтверждений. Дарвин получил некоторые новые сведения, которые доказывали универсальность как минимум нескольких типов выражения лица1, хотя его методы исследования во
1 Дарвин полагал, что только «основные» способы выражения эмоций с помощью мимики являются универсальными, хотя ему часто не удавалось опираться на это понятие, поэтому создавалось ложное представление о том, что он считал абсолютно все способы выражения эмоций универсальными.
многом были несовершенны и имели погрешности. За столетие, прошедшее со времени публикации книги Дарвина о выражении эмоций, его взгляды стали в основном игнорировать. Вместо этого более достоверной стала считаться точка зрения, основанная на таких же ненадежных сведениях, как и те, которыми пользовался Дарвин, что выражение эмоций с помощью мимики специфично для каждой культуры и универсальных правил здесь не существует. Доминирующая точка зрения заключалась теперь в том, что «то, что выражается на лице, является отпечатком культуры»1. Только за последнюю пару лет были получены достаточно достоверные сведения, благодаря которым стало возможно опровергнуть эту точку зрения и продемонстрировать, что Дарвин был, безусловно, хотя бы отчасти прав. Даже сейчас многие ученые, не знакомые с новыми доказательствами, о которых здесь пойдет речь, скептически относятся к утверждению, что существуют универсальные способы выражения эмоций.
1 Эту цитату приписывают Отто Клинебергу. Сам Клинеберг в беседе с Изардом утверждал, что никогда не говорил ничего подобного. Когда я изучал работы Клинеберга, то не нашел в них ничего такого, что напоминало бы подобное чрезмерно упрощенное заявление.
А что в России? Опыт Neurodata Lab
В начале 2016 года команда фонда Envirtue Capital пришла к мысли, что во многих аспектах имеющийся венчурный рынок России в части технологий распознавания эмоций не отвечает ожиданиям инвесторов. После этого было принято решение развивать проекты в рамках своей R&D лаборатории, полностью автономной и финансируемой из собственных источников. Так родилась компания Neurodata Lab LLC.
георгий плиев
Управляющий партнёр Neurodata Lab
С сентября 2016 года начал формироваться наш коллектив, который включает научных сотрудников ― специалистов по естественным и когнитивным наукам ― и технических экспертов с компетенциями и бэкграундом в области компьютерного зрения, машинного обучения, науки о данных.
Междисциплинарный характер исследований эмоций предопределил наш выбор в пользу смешанной команды, что позволяет думать над решением задач с разных точек зрения, объединять в одном контуре как сугубо техническую часть, так и взгляды и идеи биологии, психофизиологии и нейролингвистики.
Neurodata Lab разрабатывает решения, которые охватывают широкий спектр направлений в области исследований эмоций и их распознавания по аудио и видео, в том числе технологии по разделению голосов, послойного анализа и идентификации голоса спикера в аудиопотоке, комплексного трекинга движений тела и рук, а также детекции и распознавания ключевых точек и движений мышц лица в видеопотоке в режиме реального времени.
Один из таких проектов ―разработка прототипа софтового айтрекера EyeCatcher, позволяющего извлекать данные движений глаз и головы из видеофайлов, записанных на обычную камеру. Эта технология открывает новые горизонты в изучении движений глаз человека в естественных, а не лабораторных условиях и ощутимо расширяет исследовательские возможности.
Теперь можно узнать, как человек рассматривает картины, реагирует на звук, цвет, вкус, каково движение глаз, когда он счастлив или удивлён. Эти данные будут использованы как база для создания более совершенной технологии распознавания человеческих эмоций.
георгий плиев
Управляющий партнёр Neurodata Lab
Наша цель ― конструирование гибкой платформы и разработка технологий, которые будут востребованы частными и корпоративными клиентами из различных отраслей, включая нишевые.
При детекции и распознавании эмоций важно учитывать, что человеческие эмоции ― очень вариативная, «ускользающая» сущность, которая зачастую меняется от человека к человеку, от социума к социуму. Есть этнические, возрастные, гендерные, социокультурные различия
Чтобы выявить закономерности, нужно обучать алгоритмы на очень больших выборках качественных данных. Это та фаза, на которой коллектив нашей лаборатории сейчас и сосредоточен.
Одна из основных сложностей, с которыми сталкиваются исследовательские группы при изучении эмоций, ― ограниченность и «шумность» данных для работы с эмоциями в естественной обстановке или необходимость использовать неудобные носимые приборы для отслеживания эмоционального состояния участника эксперимента, которые искажают восприятие.
Поэтому в качестве одного из своих первых проектов команда Neurodata Lab собрала русскоязычный мультимодальный датасет RAMAS (The Russian Acted Multimodal Affective Set) ― комплексный набор данных об испытываемых эмоциях, включающий параллельную запись 12 каналов: аудио, видео, айтрекер, носимые датчики движения и другие ― о каждой из ситуаций межличностного взаимодействия.
В создании датасета приняли участие актеры из ВГИКа, воссоздающие различные ситуации повседневного общения. Сегодня доступ к мультимодальной базе данных RAMAS предоставляется бесплатно академическим институтам, университетам и лабораториям.
Стек технологий и науки
Бум AI был предсказан на 2025‒2027 годы.
Трендом станет создание умных интерфейсов распознавания человеческих эмоций. Программное обеспечение позволит определять состояние пользователя в произвольный момент времени при помощи обычной веб-камеры.
Это перспективная ниша, так как определение эмоций человека может быть использовано в коммерческих целях: от анализа восприятия видео- и аудиоконтента до расследования криминальных дел.
С другой стороны, это безграничные возможности развлекательной индустрии. Например, в iPhone X встроена технология распознавания лица Face ID, которая не только разблокирует телефон, но и может создать эмодзи с вашей мимикой:
Основная масса новых продуктов в сфере эмоциональной науки строится на семи базовых эмоциях и микроэкспрессии лица, которая отражает наши эмоции на уровне, неподвластном контролю мозга. Сознательно мы можем сдержать улыбку, но легкие подергивания уголков губ останутся, и это будет сигнал для технологий распознавания эмоций.
Есть также блок технологий, специализирующихся на анализе речи, голоса и взгляда. Использование этих методов в психиатрии или уголовном делопроизводстве позволит узнать максимум об эмоциональном состоянии человека и его истинном настрое, благодаря информации о мельчайших изменениях в мимике и телодвижениях.
Компании и отдельные команды могут использовать открытые научные данные о распознавании эмоций и использовать их в стеке с технологиями, формируя область эмоциональных вычислений (affective computing).
Технологии распознавания эмоций и закон
Прямых законодательных барьеров для эмоциональных технологий нет, а сама индустрия регулируется достаточно слабо и точечно. Есть ожидаемые барьеры и опасения: прежде всего, это проблема privacy и защиты персональных данных.
Эмоции ― это довольно личные данные о человеке, его состояниях, ощущениях, откликах на стимулы, людей и среду, о мыслях и намерениях, подчас не полностью осознаваемых рационально.
Вместе с тем всеобщая диджитализация, распространение гаджетов и девайсов любого рода, повсеместное обращение к изображениям и видео (несколько миллиардов видео попадает в сеть ежедневно), публичность в соцсетях позволяют эффективно извлекать эмоциональные данные из общего потока и использовать их для анализа человека ― как потребителя товаров и услуг и как пользователя. И всё это должно проходить в правовом поле ― корректно и этично.
Новый европейскийрегламентпо защите персональных данных (GDPR) предполагает ряд ограничений: данные для обучения и тренировки алгоритмов машинного обучения можно будет использовать свободно, если:
- они остаются деперсонализированными, то есть биосенсорные данные отделяются от биометрии (идентификация людей);
- соблюдается групповой формат (анализ толпы, множества людей, а не единичных субъектов);
- человек знает о ведении съёмки и согласен с ней; в противном случае это будет являться нарушением регламента и повлечёт за собой ответственность.
Рынок технологий распознавания эмоций — что с ним?
Он есть, но он молод, у него ещё всё впереди.
Сейчас рынок детекции эмоций переживает бум и по оценке западных специалистов к 2021 году он вырастет, по разным подсчетам, от $19 млрд до $37 млрд.
Так, по мнению влиятельного агентства MarketsandMarkets, глобальный объём рынка эмоций в 2016 году составил $6,72 млрд, и предполагается, что к середине 2020-х годах он увеличится до $36,07 млрд. Рынок эмоциональных технологий не монополизирован. Тут найдётся место и для корпораций, и для лабораторий, и для стартапов. Более того, нормальная рыночная практика: корпорации интегрируют в свои решения наработки компаний поменьше.
Эмоциональные и поведенческие технологии востребованы в различных сферах, включая медицинскую.
Обращаясь к зарубежному опыту, вспомним, как компания Empatica под руководством Розалинд Пикард первой в мире получила разрешение от надзорных органов США, ответственных за клинические испытания (FDA-клиринг), на использование их носимого браслета Embrace, который не только фиксирует физиологические данные о состоянии владельца, но и оценивает его эмоциональный фон и предсказывает вероятность наступления сложных для организма ситуаций. Это может помочь людям с расстройствами аутистического спектра, депрессией и в сложных случаях в неврологии и медицине.
Израильская компания Beyond Verbal совместно с Mayo Clinic ищет в голосе человека вокальные биомаркеры, по которым определяются не только эмоции, но и закладывается возможность прогнозирования аортокоронарных заболеваний, болезней Паркинсона и Альцгеймера, что уже подводит эмоциональную проблематику к теме геронтологии и поиску путей замедления старения.
Если говорить о применимости технологий, то тут преимущественно задействована b2b-сфера в секторах вроде интеллектуального транспорта, ритейла, рекламы, HR, IoT, gaming.
Но и в b2c тоже есть спрос: EaaS (Emotion as a Service) или же облачное аналитическое решение (Human data analytics) позволит любому пользователю загружать видеофайл и получать по нему всю эмоциональную и поведенческую статистику для каждого фрагмента записи.
Где в ближайшие годы понадобится распознавание эмоций
Здоровье и Health tech
Индустрия здоровья активно внедряет самые современные методы сбора и анализа данных о пациентах или пользователях, так как машинные алгоритмыопределяютсимптомы, используя сотни и тысячи похожих случаев.
Уже существуют мобильные приложения, которые анализируют пофотоитекступсихоэмоциональное состояние. Чем больше человек общается с программой, тем лучше она обучается, «понимает» его и даёт точные прогнозы лечения.
Одно дело, когда устройство просто улавливает, «понимает» на своем уровне ваше настроение и в соответствии с ним включает музыку, регулирует свет или готовит кофе. Другое ― когда оно по вашему внешнему виду оценивает степень усталости или определяет какие-то отклонения от нормы. Или заболевания. К примеру, болезнь Альцгеймера или Паркинсона.
Задолго до своего проявления болезнь начинает влиять на мышцы лица, на скорость движения глаз, на неощутимые, казалось бы, изменения в голосе и микродвижениях.
Криминалистика
Сериал «Обмани меня» вышел на экраны в 2009 году и сразу же получил мировую популярность. Главный герой доктор Лайтман умеет читать правду по микромимике лица. Это его «суперспособность», которая помогает найти убийцу и раскрыть сеть запутанных преступлений.
Нейроинтерфейсы могут все то же самое, только еще лучше, качественнее и быстрее. Можно снять человека в комнате для допроса и потом наложить на видео специальную программу, которая прогнозирует процент эмоций на его лице — злость, страх, горечь, обида и так далее. Эти данные помогут следствию понять, в какой момент человек мог обмануть или чего-то недоговорить.
Мониторинг социальных активностей
Считается, что интернет не передает эмоции, но это не так. По серии твитов или постов в Фейсбуке можно с высокой точностью определить, в каком настроении и состоянии находился пользователь в тот момент, когда это писал.
Самый простой пример определения психоэмоционального состояния по стилистике текста ― хорошо известная ситуация, когда человек начинает ставить точку в конце сообщения, а его собеседник воспринимает это как сигнал о том, что в разговоре что-то пошло не так.
В глобальных масштабах при помощи машинного обучения можно создать систему, которая будет отслеживать вспышки гнева, просьбы о помощи или страх в сообщениях и реагировать на них, ― например, отправлять сигнал в службы спасения.
Уже сейчас мировые ритейл-сети максимально интегрируют онлайн в офлайн, пытаясь узнать, что хочет покупатель и что он, вероятнее всего, купит. Когда нейроинтерфейсы достигнут уровня точного высокочувствительного распознавания эмоций, реклама в витрине торгового центра будет за доли секунд подстраиваться под настроение проходящих мимо людей. Подобная технология показана в фантастических фильмах, например, «Особое мнение» и «Бегущий по лезвию 2049».
Кадр из фильма «Бегущий по лезвию 2049», где голографический рекламный гиноид реагирует на эмоции на лице главного героя
В апреле 2017 года исследовательская группа из Сан-Франциско научила нейронную сеть LSTM точнее распознавать эмоциональную составляющую текста. Теперь машина почти безошибочно опознаёт настроение в отзывах покупателей на Amazon и кинорецензиях на Rotten Tomatoes, что помогает улучшить сервис и предугадать популярность продукта у пользователей.
Игровая индустрия
Когда вышла первая модель очков Google Glass, предполагалось, что управление жестами выйдет на новый уровень. Чтобы читать текст на внутренней стороне линзы, достаточно было провести глазами сверху вниз, чтобы система поняла, что вы уже прочитали этот абзац и можно показывать следующий.
Несмотря на то, что сам гаджет не вышел за рамки прототипа, история с исследованием движений глаз переместилась в новое поле — игровое.
А что дальше?
Грядущих развилок у индустрии немало, исследовательских и технологических узлов, требующих разрешения, еще больше. И всё же длительная перспектива (хотя бы до середины – конца 2020-х гг.) очевидна.
Лучшие умы человечества стремятся разобраться с тем, как устроены психологические феномены, каковы нейробиологические механизмы, чтобы воспроизвести их внутри вычислительных систем с неклассической архитектурой, вдохновленной постепенно накапливающимися знаниями о работе неокортекса.
При том что ускорение на этом пути, а такого мнения придерживается Курцвейл, неизбежно. Стоит набраться терпения. Так или иначе, но инжиниринг EI (emotional intelligence) приближает эпоху искусственного интеллекта: истинно очеловеченным интеллект машины станет только тогда, когда логика будет сбалансирована чувствами, эмоциями, ощущениями.
В конце концов, перефразируя Декарта, действительность XXI века, в которую мы уже погружены, нередко сводится к лаконичной формуле Sentio, ergo sum (я чувствую, значит, я существую). Едва ли тут что-то изменится кардинально.
Материалы по теме:
В заключение
Из теории эмоций Роберта Плутчика можно извлечь несколько практических выводов. Знание этой модели помогает быть более осознанным и лучше управлять своими эмоциями. Чтобы извлечь из этих знаний наибольшую пользу для своей жизни, стоит помнить следующие моменты:
- Нет плохих или ненужных эмоций. Все 8 базовых эмоций адаптивны, то есть необходимы для жизни и адекватного ответа на внешние стимулы. Деление на негативные и позитивные эмоции условно, а о вреде и опасности эмоций можно говорить, когда они перестают быть соразмерными ситуации и выходят из-под контроля.
- У каждой эмоции есть своя роль, импульс, который нас толкает к наиболее эффективному действию с точки зрения адаптации. Осознанный человек видит эту нить. Например, гнев обоснован и естественен в ситуации, где ваши границы каким-то образом нарушаются или есть угроза физическая или чувству собственного достоинства. А что-то отталкивающее будет вызывать отвращение и отторжение, даже если это исходит от близкого и любимого человека. И винить, стыдить себя за то, что что-то во внешнем виде любимого или какое-то его проявление вызвало в вас спонтанное отвращение, и подавлять это – глупо.
- Если вас охватывают эмоции и вам кажется, что управлять ими невозможно, вам поможет развитие осознанности и навыка лучшего понимания своих эмоций и позывов. При любом таком эмоциональном натиске задайте несколько специальных вопросов. Это позволяет не только успокоиться, но и проливает свет на то, что было сокрыто под пеленой острых эмоций и болезненных состояний. Повышая осознанность, вы начинаете лучше понимать свои потребности и движущие вами импульсы. Более того, сниженная активность лимбической системы и вновь включенный неокортекс дают возможность найти эффективные и подходящие варианты в данной ситуации. Вот эти вопросы:
Что именно я чувствую?
Какова интенсивность этой эмоции?
Как это можно назвать, обозначить наиболее точно?
Что я хочу сделать под влиянием этой эмоции, на что она меня толкает?
Что мне важно, что я хочу получить и как чувствовать себя в этой ситуации?
Какие есть иные, более уместные и эффективные способы добиться этого?
Понимание себя помогает выстраивать свою коммуникацию и взаимоотношения с ближним и дальним окружением. Помня о том, что базовые эмоции и кроющиеся за ними импульсы универсальны, и к тому же умея определять эмоции по микровыражениям мимики, вы становитесь более осознанным и компетентным коммуникатором и знатоком людской природы. Вы даже можете помочь людям лучше понимать себя и разбираться в том, что ими движет.
Эти знания и навык осознанности эмоций очень хорошо помогают в воспитании детей. Обучите своих детей простому алгоритму прояснения эмоций, описанному в третьем пункте
Покажите им важность осознанности и трезвого подхода к эмоциональным переживаниям и своим потребностям. Лучше всего, если вы сами освоите навык управления эмоциями (эмоциональной регуляции) и станете для них примером для подражания.
Итак, адаптационная модель эмоций Роберта Плутчика – это не только любопытная теория о базовых эмоциях и эволюционных предпосылках их формирования. С ее помощью возможно лучшее понимание внутреннего механизма психоэмоциональных динамик, и это знание служит большей осознанности и самоорганизации. Отталкиваясь от модели Плутчика, можно более эффективно использовать энергетический потенциал и импульс каждой из эмоций, и, сохраняя осознанность и понимание, выбирать адекватную модель поведения и ответ на ситуацию.
Напоминаем, что у нас на сайте имеется программа «Психическая саморегуляция», цель которой обучить практическим навыкам управления эмоциями и своим психическим состоянием. Она может заинтересовать тех, у кого есть сложности с контролем эмоций и уровня стресса, а также всех тех, кто просто хочет научиться управлять любыми своими состояниями.
И напоследок желаем вам осознанности и обращения своих эмоций себе на пользу!