5. Влияние музыки на настроение

     Иногда требуется всего лишь настроиться на какой-то определенный вид деятельности или просто расслабиться после трудного дня или перенесенных волнений. И здесь тоже самым эффективным средством для достижения нужной цели является музыка. В этом случае вполне допустимо слушать ее через головные телефоны. Воздействия на головной мозг будет, в общем-то, достаточно. Особенно если музыка будет мешать кому-то из посторонних. Хотя и тут надо заметить, что живой звук или прослушивание через акустические системы все же гораздо эффективнее. Настроение не в последнюю очередь зависит от общего тонуса организма, и повысить его помогает воздействие акустических колебаний на все тело, а не только на мозг.

     Наиболее значимым здесь, конечно, является соразмерность музы-кальных ритмов и ритмов головного мозга, соответствующих нужному настроению. Однако все не так просто даже в этом случае – ритмов в музыке может быть достаточно много, они могут меняться во время исполнения произведения, и общее воздействие на настроение будет определяться их текущим соотношением. Но ритмы еще не все. На настроение также способны влиять и другие параметры музыки, в том числе тональность произведения и тембры музыкальных инструментов [115-119].

     Понять связь между особенностями звучания и настроением, передаваемым музыкальным произведением, люди также пытались с древнейших времен. К примеру, в индийской раговой системе каждая рага имеет свой звукоряд и характерные музыкальные фразы, довольно строго определенные, которые, как предполагается, и придают ей свою эмоциональную окраску. Однако более глубокое изучение восприятия эмоциональных аспектов музыкальных композиций началось сравнительно недавно – быстрый рост числа публикаций и исследований на данную тему начался ближе к середине ХХ века – вероятно, как следствие развития нейронаук, психоакустики и множества других смежных областей. Конец ХХ – начало ХХI вв. характеризуются активным развитием вычислительной техники и информационных технологий, что существенно расширило возможности анализа музыки. Стимулом к увеличению числа исследований стало и возникновение спроса на так называемые музыкальные подборки различного назначения.Следствием наличия такого спроса встал вопрос возможности автоматизации данного процесса с помощью специализированных программ. Но для создания таких программ требовалось сначала понять, что именно и как влияет на восприятие нами музыки.

     Восприятие музыки располагается на стыке разных наук, таких как физика, психоакустика, математика и музыковедение. Каждая из них в равной степени важна для понимания феномена музыки. Задача физики – понимание механизма создания звука музыкальными инструментами, что является ключом к созданию и усовершенствованию музыкальных инструментов. Психоакустика фокусируется на другой стороне природы звука – эффекте, который оказывает музыка на человека, что, в свою очередь, близко к сфере когнитивной психологии; она имеет дело с высшим уровнем организации слышимых звуков и анализом музыкальной картины. Значительный вклад вносят и теория музыки с музыкальной психологией. Они рассматривают высокоуровневое моделирование таких музыкальных структур, как тональность, размер или гармония [120-122].

     Слух человека способен оценивать и сравнивать звуки по разным параметрам: высота тона, громкость, тембр, консонанс-диссонанс и другие. Этим слуховым ощущениям можно поставить в соответствие физические параметры звуковых колебаний, такие как частота, интенсивность, спектр.
 
     Высота тона – это атрибут, по которому звуки можно упорядочить по частотной оси от низких частот к высоким. Малая высота тона соответствует низким частотам, а большая наоборот – высоким частотам. Но не только частота определяет высоту тона. Изменение воспринимаемой высоты звука происходит и при изменении интенсивности звуковых колебаний. Ухо более чувствительно к изменениям частоты в области высоких частот. Ощущение высоты сложных звуков основано на явлении периодичности. Считается, что обработка высоты тона практически равнозначна обработке периодичности. В то же время, восприятие высоты тона почти не зависит от фаз отдельных составляющих. Можно сказать, что слуховая система человека обладает способностью приблизительно оценивать период, которая и используется для определения высоты тона. В пользу данного утверждения можно привести следующие факты:

     - слуховая система способна раздельно воспринимать несколько составляющих сложного тона;

     - предполагается, что слуховая система способна узнавать и запоминать частотные интервалы между этими составляющими. Существуют некоторые периодические сигналы с различными фундаментальными частотами, имеющие важное биологическое значение, к значимым сигналам относятся и звуки речи. Поэтому высока вероятность, что слуховая система запомнит какую-либо особую систему составляющих как некий образец;

     - в целом, при запоминании высшими отделами слуховой системы воздействия со своей характерной структурой, эта структура при повторном появлении будет воспринята как отдельный целостный объект, а не как бессмысленный набор составляющих;

- когда высшая слуховая система развивает способность воспринимать структуру как отдельный целостный объект, данная структура будет опознана даже при отсутствии некоторых ее элементов, если оставшихся элементов достаточно для распознавания данной структуры;

     - еще один способ пронаблюдать за повторяемостью высоты тона заключается в представлении группы совместно звучащих чистых тонов, равно разнесенных по частоте. Тогда определяемая высота тона будет соответствовать разности частот между каждой составляющей.

     Основываясь только на простой модели слуховой системы, нельзя объяснить множество явлений, например, восприятие сложных тонов или даже еще менее понятный феномен отсутствующей фундаментальной частоты. В соответствии с теорией виртуальной высоты звукового тона в основе слухового восприятия лежит совокупность аналитического слушания и холистического (целостного) восприятия. Данный подход хорошо объясняет восприятие звука таких инструментов, как колокола, которые имеют негармонический спектр, а слышимый тон определяется компонентами с четвертой по шестую.

     Феномен отсутствующей фундаментальной частоты состоит в том, что слух способен правильно определят высоту тона по высшим гармоникам (2-я, 3-я и т.д.) этого тона даже  при физическом отсутствии основной гармоники.

     То, чего слуху не хватает в некоторых областях (низкая чувствительность, эффекты маскировки) компенсируется скоростью, точностью и исключительной способностью приходить к заключениям на высшем уровне. Ухо способно выделить говорящего из толпы (эффект вечеринки) и следить за выбранным голосом в полифонической записи без привлечения других чувств. Исследователи в областях психоакустики и физиологии заинтересованы в понимании физических, нервных и физиологических процессов, которые делают возможным восприятие звука, с тем, чтобы использовать эту информацию для создания моделей слуховой системы. Можно работать с низкоуровневым моделированием, чтобы выяснить саму суть слуховой системы, либо с перцептуальными моделями, воссоздающими высший уровень данной структуры [123-124].

     Музыка имеет множество определений, и в самых общих чертах это упорядоченная по высоте и времени последовательность звуков. Однако психоэмоциональные аспекты музыки при таком определении остаются нераскрытыми. Прослушивание музыки вызывает различные реакции организма, как психологические, так и физиологические. В слуховое восприятие также могут вовлекаться и другие органы чувств помимо непосредственно слуховой системы. Кроме того, в обработке музыкальных сигналов задействованы самые разные области головного мозга.

     1) Синестезия
     Синестезия является ярким примером участия различных сенсорных систем в слуховом восприятии. Предполагается, что синестезия возможна благодаря наличию дополнительных связей между участками мозга, отвечающими за слуховое и зрительное восприятие. Ее также называют «видением» звуков, «слышанием» цветов, что является следствием взаимных отношений и связей разных чувств. Наиболее распространенный случай музыкальной синестезии проявляется как видение цветов или узоров при прослушивании или сочинении музыки.

     2) Временные (ритмические) эффекты

     Предполагается, что восприятие ритма в музыке является ключом к пониманию способностей слухового восприятия правого полушария мозга. Многие природные звуки и процессы ритмичны. Помимо ритма дыхания важнейшим ритмическим звуком в нашей жизни является звук биения сердца. Многочисленные исследования показали, что при прослушивании музыки, в отличие от шумовых сигналов, наблюдается высокая активность в мозжечке – одной из самых древних частей головного мозга. Таким образом, было высказано предположение, что мозжечок участвует в восприятии ритма и в восприятии времени в целом [125].

     3) Двигательные эффекты

     Музыка напрямую связана с нервной организацией позиций и движений. Композиция, представление и прослушивание подразумевают широкую вовлеченность моторной коры головного мозга, подкорковых двигательных и сенсорных ядер и лимбической системы.

     4) Другие телесные реакции

     Прослушивание музыки приводит к изменениям кровяного давления, частоты сердечных сокращений и дыхания и других автономных функций. Эти независимые изменения представляют вегетативные проявления психологических процессов. Наивысшие частоты сердечных сокращений достигаются не при больших физических усилиях, но при прослушивании пассажей, вызывающих сильнейший эмоциональный отклик.
 
     5) Нейронная активность

     Между музыкой и фундаментальной активностью нервной системы наблюдается сильное сходство. Характеристики нервных импульсов – время следования, интенсивность, синхронность, перепады частоты, наличие определенных структур (паттернов) – можно соотнести со многими аспектами музыкальной композиции.

     6) Эмоциональные аспекты восприятия музыки

     Выше уже было отмечено, что в восприятии и трактовке музыкальных произведений задействованы сразу несколько участков и отделов головного мозга, в том числе и мозжечок. Изначально предполагалось, что его функция при прослушивании музыки заключается в определении ритмических структур, однако в дальнейших экспериментах выяснилось, что активность мозжечка выше, когда человек слушает музыку, которая ему нравится, и ниже в обратном случае. Объяснением тому стало выявление многочисленных связей мозжечка с важнейшими эмоциональными центрами мозга, такими как миндалина и лобные доли [126, 127].

Об участии в восприятии эмоций в музыке гипоталамуса и о том, что совокупность различных ритмов в музыке способна формировать определенные эмоциональные реакции мы уже говорили.

    При исследовании проблем распознавания настроения в музыке у ученых возник вопрос: а что же все-таки понимать под эмоциями в музыке? Настроение произведения, заложенное в него композитором, или  эмоции переживаемые слушателем? И вообще – это одно и то же или нет? В процессе обсуждения данной проблемы выяснилось, что на этот счет существуют разные точки зрения. В последнее время большинство исследователей склоняются к тому, что это хотя и очень близкие категории, но все-таки не равнозначные. Так, например, человек способен сказать, что песня вообще-то веселая, но совершенно не обязательно будет переживать это приятное чувство сам. С другой стороны, музыка способна вызывать сильнейший эмоциональный отклик, вполне соответствующий ее содержанию: человек, прослушав печальную песню, может не сдержать слез. Но самое интересное, что испытанный при этом эмоциональный опыт может быть оценен слушателем позитивно, например, ему понравится эта песня или он почувствует эмоциональный подъем, несмотря на то, что сама по себе печаль и грусть считаются скорее отрицательными эмоциями, чем положительными. Таким образом, можно сказать, что эмоциональное воз-действие музыки складывается из двух факторов: заложенного композитором и выраженного соответствующим образом смыслового содержания и настроения с одной стороны, и непосредственной реакции слушателя на произведение с другой стороны.

     Понятно, что предугадать эмоциональный отклик каждого слушателя невозможно, поскольку он будет разным не только у разных людей, но и даже у одного и того же человека в зависимости от его музыкальных предпочтений, общего уровня интеллекта, от того, настроен ли он в данный момент на восприятие данной музыки или нет, и других факторов. Может слушатель просто не любит такую музыку (любители джаза, например, презирают «попсу», т.е. примитивную популярную музыку), или не понимает ее (любители «попсы» не понимают классики). Но это уже можно отнести к категории музыкальных предпочтений и настроение здесь ни при чем. Тем не менее, даже если музыка не заставит слушателя полностью прочувствовать те эмоции, которые она в себе содержит, определенную атмосферу она все равно создаст. Поэтому, создавая системы автоматической классификации звукозаписей по критерию содержащегося в них настроения, разумнее всего воспользоваться упомянутым ранее свойством анализировать настроение музыкальной композиции, уже заложенное в ней, по каким-то объективным признакам, вне зависимости от собственной эмоциональной реакции на нее, т.е. попытаться исключить субъективный фактор в оценке. Именно такого подхода придерживается большинство современных исследователей.

               5.1. ТЕРМИНЫ,ОПРЕДЕЛЯЮЩИЕ НАСТРОЕНИЕ В МУЗЫКЕ

         Прежде чем приступать к анализу параметров, необходимых для распознавания настроения в музыке, необходимо определить термины, которые бы это настроение описывали. Однако музыкальное произведение часто содержит в себе сразу несколько эмоциональных составляющих, которые, во-первых, могут быть представлены в различном соотношении и изменяться на протяжении звучания всего произведения, и, во-вторых, иметь множество градаций, причем эти градации (нюансы) будут отмечены разными слушателями в разной мере. Следовательно, необходимо:

     а) сократить число прилагательных или тегов, соответствующих эмоциональным категориям до такого количества, которое было бы не слишком большим, но в то же время достаточно полно описывало присущее данному музыкальному произведению настроение, и

     б) классифицировать теги для удобства анализа и поиска. Отсюда вытекает другая проблема: существование множества различных подходов к описанию и классификации эмоциональных категорий. Рассмотрим наиболее широко применяющиеся в настоящее время. 

     В системе MIREX (MusicInformationRetrievalEvaluationeXchange) прилагательные, описывающие настроение, организованы в пять кластеров. Поскольку это международная классификация, то будем вначале приводить их англоязычные названия, а потом приблизительный русскоязычный. Приблизительный потому, что не всегда англоязычные термины однозначно интерпретируются по-русски.

     1.passionate, rousing, confident, boisterous, rowdy;
(страстный, воодушевляющий, уверенный, яростный, буйный).
    2.rollicking, cheerful, fun, sweet, amiable/goodnatured;
(бесшабашный, бодрый, веселый, приятный, дружелюбный/добрый).
     3.literate, poignant, wistful, bittersweet, autumnal, brooding;
(образованный, трогательный, тоскующий, горькая радость, осенний, задумчивый).
     4.humorous, silly, campy, quirky, whimsical, witty, wry;
(комичный, глупый, вычурный, странный, эксцентричный, остроумный, противоречивый).
      5. aggressive, fiery, tense/anxious, intense, volatile, visceral.
(агрессивный, вспыльчивый, напряженный/тревожный, сильный, изменчивый, примитивный).

Существуют еще две распространенные модели – это модель Хевнер и модель Рассела. Первая включает в себя список из 67 прилагательных, сгруппированных по восьми кластерам. Ее мы здесь рассматривать не будем. Вторая использует так называемую двумерную модель Валентность/Возбуждение (Valence/Arousal) (рис. 3.1).

Термин «Валентность»,который здесь используется, означает предрасположенность к чему-то, вероятность появления или ожидание какой-либо эмоции. Он может иметь как позитивный, так и негативный смысл. От несчастного подавленного состояния до довольного и радостного.

    Существует также расширенная модель Валентность/Возбуждение, в которой эмоции распределены в трех измерениях: Валентность, Возбуждение-Энергичность и Возбуждение-Напряженность (рис. 3.2). В исследованиях последних лет все более распространенной становится именно такая, расширенная модель, которая в наиболее полной мере описывает эмоциональное впечатление, а также лишена такого недостатка кластерных моделей, как перекрытие категорий. В то же время, эмоции, определенные в кластерных моделях несложно перенести на координатную плоскость либо в трехмерную систему [128-135].

             5.2. ПАРАМЕТРЫ, ОПРЕДЕЛЯЮЩИЕ НАСТРОЕНИЕ В МУЗЫКЕ

     С точки зрения психоакустики звуковой сигнал можно описать с помощью следующих характеристик: длительность, громкость, высота тона и тембр.

     Длительность – это время от начала до конца рассматриваемого звукового сигнала. Общую продолжительность звука можно разделить на четыре этапа: атаку (attack), спад (decay), стационарную часть (sustain) и затухание (release) в зависимости от вида огибающей сигнала (рис. 3.3). Не у всех звуков обязательно присутствуют все четыре фазы, а в определенных случаях большое значение могут иметь и участки с тишиной. Характер огибающей является важнейшим параметром при выделении звука инструментов.

     Громкость – это слуховое ощущение, соотносимое главным образом с изменениями звукового давления, вызываемыми производимым звуком. Чаще всего ее определяют как атрибут слуховой системы, позволяющий упорядочивать звуки в шкале, простирающейся от тихих до громких.

     Высота тона определяется как атрибут слухового восприятия, по-зволяющий упорядочивать звуки в шкале от низких к высоким. Однако есть и другие определения. Так, высоту тона часто связывают с понятием фундаментальной частоты. В психоакустике высота тона главным образом относится к частоте звука, но также зависит от продолжительности, громкости и тембра.

     Данное определение соответствует так называемой «спектральной высоте тона». Наряду со спектральной высотой тона существует явление виртуального тона, то есть способность слухового восприятия воспроизводить пропущенную фундаментальную частоту сложного тона по его гармоникам.

     Еще одно свойство, относящееся к высоте тона, – субъективная сила слухового ощущения высоты тона. Так, например, чистый тон создает более сильное ощущение высоты тона, чем высокочастотный шум. В целом, высота тона определяется формой спектра. Звуки с линейчатым спектром и узкополосный шум вызывают более сильное ощущение высоты тона, чем сигналы с более широким спектром.

     Тембр – наиболее сложный параметр из представленных. Стандарт ANSI дает такое определение: тембр – это атрибут слухового ощущения, который позволяет слушателю судить, что два звука, имеющие одинаковую высоту и громкость, отличны друг от друга. Например, тембр отражает различие между слуховыми ощущениями, вызываемыми разными музыкальными инструментами, играющими одну и ту же ноту.
В отличие от описанных выше свойств, у тембра нет единственного физического аналога. Этот параметр многомерен и зависит как от стационарных, так и от нестационарных структур. Учитывается и распределение энергии внутри критических полос (т.е. тональный или шумоподобный характер звука и его гармоническая структура). Более того, в процесс восприятия тембра включается и каждый звуковой аспект, который изменяется во времени (к ним относятся изменения огибающей спектра и временных характеристик: атаки, спада, поддержки и затухания). Предшествующие и последующие звуки также влияют на тембр. Все это делает проведение объективных измерений для оценки тембра крайне сложной задачей.
Ко всем сложностям, возникающим при оценке каждого из свойств:
продолжительности, громкости, высоты тона и ее силы, тембра, прибавляется и то, что действие этих параметров не обособлено. Хотя и по отдельности каждый из этих параметров вносит значительный вклад в воспринимаемое настроение, полноценная эмоциональная картина складывается из совокупного воздействия данных факторов.
Так, на восприятие высоты тона влияет не только частотный состав сигнала, но и звуковое давление и форма волны. К примеру, воспринимаемая высота тона звуков с частотами выше приблизительно 2 кГц увеличивается с ростом амплитуды, в то время как звуки ниже этой частоты при большей амплитуде кажутся ниже. Обычно для оценки высоты тона используются модели человеческого восприятия. Оценка производится посредством сравнения машинных измерений с оценкой, данной человеком.

     Лишь некоторые звуки не имеют высоты тона, такие как широкополосный шум. Звуки такого рода производятся, например, ударными инструментами и являются одной из самых насущных проблем в области распознавания и извлечения информации о музыке в целом.

     Отчетливость ощущения высоты тона зависит от длительности, амплитуды и частоты сигнала и в случае чистых тонов возрастает с увеличением амплитуды и длительности, достигая максимума в частотном диапазоне от 1 до 3 кГц. 
Громкость зависит не только от звукового давления, но и от частоты, формы и длительности сигнала. Звуки с длительностью менее 100 мс кажутся тише, чем те же звуки с большей длительностью. Более того, ощущение громкости меняется с частотой, что хорошо отображают кривые равной громкости. Таким образом, для описания вышеназванных качеств звукового сигнала требуется достаточно обширный набор величин.
 
Однако помимо психоакустических характеристик, существуют и другие параметры, которые обычно рассматривают с позиций музыковедения. К таким параметрам относятся ритм, темп, мелодия, гармония, лад, тональность, а также динамика. Поскольку и психоакустические, и музыкальные параметры важны для распознавания настроения в музыке, имеет смысл учитывать и те, и другие. Практика показала, что наибольшей значимостью обладают спектральные характеристики (связанные в основном с определением тембра) и гармонические (тональные, связанные с модуляциями высоты тона). Ритмические и энергетические параметры сами по себе вносят немного меньший вклад, но заметно увеличивают точность определения настроения при использовании вместе со спектральными и гармоническими.  Таким образом, наиболее важными параметрами являются темп, ритм, тембр и тональные параметры [136-145].

                5.2.1. ТЕМП И РИТМ

Специфическая последовательность звуковых сигналов и пауз может быть воспринята как некоторый ритм. Ритм может быть воспринят, если звуковые события распределены внутри временного интервала некоторой критической длительности. При слишком малой, равно как и слишком большой длительности этого интервала ритм перестает восприниматься.

     В музыке ритм является частью мелодической структуры, а темп задает скорость структуры мелодии, таким образом, ритм и темп тесно связаны. Ритм определяют как порядок и меру длительности. Темп описывают как характеристику движения при исполнении музыки.

     По мнению многих исследователей, информация, которую несет о настроении ритм, составляет приблизительно 40%. Таким образом, ритм можно расценивать как один из самых фундаментальных музыкальных компонентов. Появление ритма, похоже, было первым шагом в развитии музыкальной культуры. Ритмы сопровождают всю нашу жизнь от самого рождения: биение сердца и дыхание являются основными биологическими ритмами, наряду с ними существуют и другие, а цикличность и повторяемость характерна не только для большинства процессов, происходящих в организме, но в целом свойственна природе.

Исходя только из этой связи, можно предположить, что увеличение темпа музыки будет способствовать усилению возбуждения, а уменьшение, наоборот – успокоению.
Таким образом, медленная музыка скорее будет спокойной, расслабляющей либо печальной и мрачной, а быстрая – возбуждающей, веселой либо агрессивной в зависимости от валентности. Влияние же ритмического рисунка понять несколько сложнее, но можно предположить, что простые ритмические рисунки будут в основном связаны с более позитивными эмоциями, такими как радость и спокойствие, а сложные придадут музыке напряженность.

     В одном из довольно сложных экспериментов, поставленном для выяснения связи между ритмом, темпом и настроением,  использовалась композиция, включавшая в себя женский вокал (мелодия без слов), электрогитару, синтезированный бас, синтезатор и ударные. Общий состав инструментов не изменялся, менялась только ритмическая часть (партия ударных). Эксперимент проводился при одной и той же аранжировке, но с изменяющимся ритмом и в разном темпе. Это было сделано, чтобы исключить влияние других факторов, например, тональности, гармонической последовательности и общей инструментовки.  Барабанщик играл пять разных ритмов, соответствовавшим разным жанрам.

     Слушателей просили оценить, в какой степени то или иное исполнение описывает настроение прослушиваемой музыки. Термины для описания настроения, использованные в опросе, тоже были заданы: Агрессивное, Оживленное, Возбужденное, Радостное, Печальное, Спокойное.Всего было 40 слушателей: 19 мужчин и 21 женщина. Средний возраст слушателей - примерно 25 лет.
Результаты проведенных тестов и статистическая обработка результатов показали, что в общем случае настроение в музыке находится в сильной зависимости от темпа. Изменение ритма при неизменном темпе вызывает менее значимые изменения в восприятии настроения.

     Если оценивать результат чуть более детально, то можно отметить следующее:

     - медленный темп действительно соответствует эмоциям, расположенным в нижней части плоскости Валентность/Возбуждение, то есть, настроение медленной музыки, скорее всего, будет спокойным или печальным;

    
     - с увеличением темпа в музыке начинают преобладать эмоции, характеризующиеся высоким возбуждением и сопровождаемые увеличением активности, то есть, быстрой музыке скорее будут присвоены такие категории, как оживление, радость, либо же агрессия, в зависимости от характера валентности;

     - в свою очередь, на значения валентности большое влияние оказывает ритмический рисунок. К сожалению, в настоящий момент влияние именно ритмического рисунка на настроение мало изучено, так как существует огромное разнообразие ритмических рисунков и для выявления четких закономерностей и связей необходимо провести большое количество исследований;

     - однако в целом можно сказать, что более простые ритмы более соответствуют положительной валентности, чем сложные [146-155].   


                5.2.2. ТЕМБР И СПЕКТРАЛЬНЫЙ ЦЕНТРОИД

     В отличие от других параметров звука, тембр является многомерным параметром и охватывает как спектральную, так и временную области, что делает его одним из наиболее сложных для анализа параметров. Помимо этого, тембры акустических инструментов могут изменяться в зависимости от регистра и динамики (громкости, с которой играет музыкант).

     Тембр способен влиять на воспринимаемые эмоции даже отдельно от других характеристик звука. Показано, что слушатель способен определить эмоциональную окраску одиночного короткого (порядка 250 мс) звука, то есть, даже единственной ноты достаточно, чтобы слушатель уже смог сделать выводы об эмоциональной составляющей.
 
     Тембр связывают с отдельными эмоциями. В общих чертах, яркие звуки ассоциируются с радостью, приглушенные с печалью, резкие со злостью, а мягкие как со страхом, так и с нежностью. Причем на эмоциональный оттенок музыки влияют различные характеристики звучания, совокупность которых образует тембр, например, временной и спектральный центроид, отношение высокочастотных и низкочастотных составляющих, характер атаки, форма спектра.

     Набор величин, определяемых для получения информации о тембре, варьируется в разных исследованиях и методах распознавания настроения в музыке, однако можно выделить несколько основных величин, измерение которых всегда входит в процедуру определения тембральных характеристик: спектральный центроид,дисперсия спектра,смещение спектрального центроида и флуктуации или некогерентность спектра.

     Спектральный центроид SC. Определяется как центр тяжести спектра амплитуд (первый момент). Он определяет ту точку в спектре, где сосредоточена большая часть энергии, и связан с доминирующей частотой сигнала:
                SC=(;;;A_i F_i ;)/(;;A_i ),
где Ai - амплитуды составляющих спектра сигнала, Fi – их частоты.

С точки зрения восприятия, спектральный центроид тесно связан с понятием яркости тембра. При сдвиге спектрального центроида в сторону более высоких частот звук кажется более ярким и наоборот.
Дисперсия спектра SS. Характеризует ширину полосы частот, представляет собой отклонения спектра от центра тяжести SC:
SS=(;;;;(F_i-SC);^2 A_i ;)/(;;A_i ).

Смещение спектрального центроида SCD.
    Смещение спектрального центроида характеризует изменения спектральных компонент с течением времени и представляет собой среднеквадратическое отклонение спектрального центроида во времени:

                SCD=;(1/N ;_(n=0)^(N-1);;(SC(t_n )-;SC;_xx);^2 ),
где SC xx может быть средним, среднеквадратичным или максимальным значением SC.
Флуктуации спектра или некогерентность спектра – Spectral Incoherence (SI) является мерой того, насколько спектр рассредоточен относительно гармоник основного тона и насколько его составляющие меняются во времени.

      «Когерентная» версия k-той гармоники описывается выражением
 
где А ;_k- усредненное по времени значение амплитуды k-той гармоники. Тогда спектральная некогерентность:
 
     Значения некогерентности находятся на интервале от 0 до 1. Чем больше некогерентность, тем более динамичный спектр и наоборот, меньшая некогерентность соответствует более статичному спектру, а идеально статичный спектр имеет нулевую некогерентность.

     Чтобы определить влияние тембра на настроение в музыке, был проведен эксперимент, с использованием нескольких инструментов, имеющих разные тембры звучания: фагота, кларнета, флейты, рожка, гобоя, саксофона, трубы и скрипки. Участникам предлагалось попарно прослушивать звуки инструментов и сравнивать их в рамках определенных эмоциональных категорий: Радость, Печаль, Героизм, Испуг, Комичность, Застенчивость, Удовольствие, Подавленность.

     Как показали результаты эксперимента, спектральные характеристики инструментов тесно связаны с настроением. Особенно сильная корреляция наблюдается между настроением и значением спектрального центроида. Так,смещения спектрального центроида в сторону высоких частот ассоциируются с более положительными эмоциями (или – с более высокой положительной валентностью в системе Валентность/Возбуждение) и наоборот. Если вспомнить, что спектральный центроид отвечает за такую характеристику тембра, как яркость, то можно сказать, что более яркие тембры скорее будут ассоциироваться с такими эмоциями, как Радость и Удовольствие. Однако не только спектральный центроид сам по себе влияет на настроение в музыке, но и его смещение, которое является мерой изменения состава спектральных компонент с течением времени.

     Чтобы понять, влияют ли другие спектральные характеристики, помимо спектрального центроида и его отклонения, на воспринимаемое настроение, был проведен другой эксперимент - с звучанием тех же самых инструментов, но с приведенными к одному значению (3.7) спектральными центроидами. В результате такого выравнивания звуки инструментов стали казаться более похожими, и участникам эксперимента было сложнее сравнивать тембры по эмоциональным категориям. Различия, тем не менее, по-прежнему имели место, но теперь решающим фактором стало отношение четных гармоник к нечетным. Особенно заметна связь этого отношения с такими эмоциями, как Радость, Печаль, Удовольствие и Подавленность, причем инструмент с самым высоким отношением четных гармоник к нечетным (саксофон) был практически однозначно отнесен к инструментам с радостным звучанием, в то время как кларнет, у которого это отношение было наименьшим, был отмечен участниками как инструмент с наиболее печальным звучанием.

     Еще более наглядно отобразил влияние соотношения четных и нечетных гармоник результат эксперимента, в котором спектры звучания инструментов оставались неизменны во времени (то есть, отсутствовало смещение спектрального центроида). Здесь практически все эмоциональные категории показали зависимость от соотношения гармоник, за исключением категории «Пугающий», на выраженность которой заметно повлияло только смещение спектрального центроида [156-161].

                5.2.3. ТЕМБР И РЕГИСТР

     Еще один эксперимент был проведен для выявления совместного влияния на воспринимаемое настроение тембра и высоты тона (регистра). Известно, что тембральные характеристики инструментов меняются с изменением высоты извлекаемых звуков. Логично предположить, что эмоциональная окраска произведения будет изменяться в зависимости, как от тембра, так и от регистра. В отличие от предыдущего исследования, в данном эксперименте были рассмотрены группы инструментов, так как характеристики инструментов, принадлежащих одной группе, похожи. При этом использовалась трехмерная модель эмоциональных категорий (Валентность, Возбуждение-Энергичность и Возбуждение-Напряженность). Однако учитывая, что все отдельные эмоциональные категории можно расположить в данной системе координат, будет несложно проанализировать результаты обоих экспериментов в совокупности.

     В эксперименте принимали участие, как музыканты, так и обычные слушатели без опыта игры на музыкальных инструментах. Видно, что в восприятии тембров между этими группами людей имеются некоторые различия, но общие тенденции похожи. Рассмотрим зависимости значений для каждой координатной оси.

     1)Влияние тембра и высоты тона на Валентность

     Начиная с наименьшей высоты тона (До-диез первой октавы или ре-диез контроктавы) валентность возрастает в положительную сторону до второй октавы, а затем достаточно быстро убывает для всех групп инструментов, за исключением перкуссионных, для которых валентность плавно растет с увеличением регистра. Наибольший положительный рост валентности, равно как и наибольшие ее значения наблюдаются для струнных инструментов. При этом в предыдущем эксперименте скрипка показала наивысший результат для радостного настроения, которое характеризуется высокой валентностью. Самые маленькие значения валентности показала группа деревянных духовых инструментов, а рост валентности достаточно неравномерный. В предыдущем исследовании звучание флейты больше всего соответствовало категориям печали, подавленности и робости – а это эмоции с низкой валентностью. Неравномерность роста валентности для данной группы музыкальных инструментов, скорее всего, объясняется тем, что тембральные характеристики инструментов внутри этой группы могут значительно отличаться друг от друга (вспомним, что кларнет и саксофон лидировали в эмоциональных категориях с высокой положительной валентностью, в то время как гобой в основном показывал нейтральные характеристики).

     2) Влияние тембра и высоты тона на Возбуждение-Напряженность
В общем случае, напряженность звучания всех групп инструментов имеет наименьшие значения в среднем регистре (большая, малая и первая октавы) и быстро возрастает с увеличением высоты тона, причем наибольшую напряженность показали инструменты из группы медных духовых. Наименьшую напряженность имеют звуки струнных инструментов, особенно в регистре большой октавы, однако они же, звучащие в низком регистре (для ноты ре-диез контроктавы частота звуковых колебаний составляет 38,891 Гц), показывают самые высокие значения напряженности. Высокая напряженность в этом диапазоне характерна и для других групп инструментов.
     3) Влияние тембра и высоты тона на Возбуждение-Энергичность
Для всех групп инструментов отмечается возрастание энергичности с ростом высоты звуков, при этом сами по себе значения энергичности близки. Наибольшие отличия в энергичности звучания разных групп инструментов наблюдаются в самых нижних регистрах, причем перкуссия была отмечена участниками эксперимента как наиболее энергично звучащая, за ней следуют струнные инструменты, затем духовые инструменты обеих групп. Таким образом, чем выше регистр, в котором играют инструменты, тем более оживленной и бодрой воспринимается музыка [148, 150, 153].

                5.2.4. ТОНАЛЬНЫЕ ПАРАМЕТРЫ

     Одной из наиболее характерных особенностей слухового восприятия человека является способность определять высоту тона сложных звуков. Это – аналитическое слушание. С другой стороны, человек также может обобщить услышанное. Встречая следующие друг за другом звуки, мы можем услышать мелодический паттерн, а не воспринимать каждый звук как отдельное событие. Такое обобщение называют холистическим (то есть целостным) слушанием.

     Первый вид слушания может заключаться в распознавании отдельных инструментов, в то время как второй можно расценивать как способность распознать музыкальное произведение, принадлежащее к данному музыкальному стилю. В музыковедении существуют разные подходы к анализу музыки. Одним из базовых подходов по отношению к рассмотрению тональной музыки в простейшей форме остается гармонический анализ, предложенный австрийским теоретиком музыки и педагогом Генрихом Шенкером (1868-1935). Его теория тональной музыки определяет мелодическую структуру как диатонический ряд, получаемый посредством аналитического упрощения, когда удаляются верхние структуры. Оставшаяся основная мелодическая структура называется первичной линией (Urlinie). Шенкер расширил это понятие до основ композиции и, наконец, до общего понятия структурных слоев: задний план, средний план и передний план. Задний план сокращает музыку до наиболее значительного материала, часто состоящего только из 3-5 нот. В свою очередь, передний план – это представление в виде записи нот в произведении в очень подробном виде, рассматривая произведение до мельчайших элементов. Основная идея структурных слоев предполагает иерархическое разделение музыкальных составляющих, что, в свою очередь, создает основу для описания и толкования отношений между элементами композиции. Эти выводы основываются на идее, что удаление верхних слоев выявляет ядро музыкальной фразы, которое в некоторых случаях может иметь в своем составе всего одну ноту. Так или иначе, настроение музыкальной композиции создают структуры каждого плана[162-164].
Диссонанс и консонанс. Диссонансом называют неприятное, «шероховатое» на слух звучание, а консонансом, напротив, приятное, слаженное звучание. Ощущения диссонансности и консонансности созвучий связано с наличием критических полос слуха – то есть полос частот, в пределах которых энергия звукового сигнала интегрируется ухом. Они также тесно связаны с явлением биений, когда при сложении колебаний с близкими частотами между ними возникают пульсации, частота которых равна разности частот этих колебаний:

                f_б=f_1-f_2

     Эксперименты показали, что консонансность или диссонансность звучания определяется отношением разности частот колебаний к ширине критической полосы, в которой они находятся. Если это отношение составляет 0 – 4 % или более 50%, то созвучие воспринимается как консонанс, в противном случае звучание будет несогласным, а максимальное ощущение диссонанса возникнет, когда разница частот будет равна четверти ширины критической полосы.

     Критической полосой слуха называется полоса частот, в пределах которой человеческое ухо интегрирует энергию звукового сигнала и не различает тонкой структуры возбуждения.

     В диапазоне от 20 до 19500 Гц число критических полос слуха у человека равно 24. Ширина этих полос увеличивается от низких частот к высоким – от 80 Гц на низких частотах до 3,5 кГц на высоких.

     Консонанс и диссонанс играют огромную роль в музыке, внося значительный вклад в эмоциональную выразительность. Эксперименты, проводимые для определения влияния консонанса и диссонанса на настроение, обнаружили положительную корреляцию диссонанса с выражениями страха и гнева и наоборот, менее диссонантное звучание ассоциировалось с более положительными эмоциями: радостью и нежностью. Достаточно интересен тот факт, что грусть также соответствовала более гармоничному звучанию, что позволяет сделать предположение о влиянии диссонанса не только на валентность, но и на остальные измерения  в трехмерной эмоциональной модели.

     Мерой диссонантности является так называемая «шероховатость», для определения которой вычисляются спектральные максимумы и определяются расстояния между ними. Спектральные максимумы консонантных созвучий расположены, как правило, более равномерно, в то время как спектр диссонансных созвучий имеет более нерегулярную структуру. Сначала оценивается диссонантность для всех возможных пар спектральных максимумов, а затем вычисляется ее среднее значение [123, 124, 165, 166].
 
     Лад. В Западной музыкальной системе существуют два основных лада: мажор и минор. Композиции, написанные в миноре, обычно воспринимаются как более печальные или мрачные, а мажорные – как веселые и торжественные. Также с мажором тесно коррелирует такое чувство как нежность, а с минором – страх. Если рассматривать модель Валентность-Возбуждение, то музыка, в которой преобладает мажорный лад, вызывает эмоции с большей положительной валентностью, чем музыка с преобладающим минором.

     Проблема такого подхода в том, что в действительности музыкальные лады не ограничиваются только мажором или минором. В музыке разных народов мира с давних времен использовались и другие лады (натуральные лады в греческой музыке, арабский макам, индийская рага и многие другие), каждый из которых имеет свои выразительные и эмоциональные характеристики, поэтому влияние музыкального лада на настроение является предметом дальнейших исследований [165].

     Мелодия. Мелодия представляет собой особым образом организованную последовательность нот, которая воспринимается как целое и обычно трактуется как отдельный голос в произведении. Мелодия как элемент музыкальной композиции обладает, пожалуй, наибольшей эмоциональной выразительностью. В то же время, автоматическое определение того, как звучит – с точки зрения настроения – та или иная мелодия, представляется непростой задачей. Подробный разбор каждой отдельной мелодии нецелесообразен, поскольку самих мелодий может быть бесчисленное множество, но оказывается, что в этом и нет необходимости, поскольку есть факторы, влияющие на восприятие мелодии, которые не связаны с конкретными последовательностями определенных нот [166-170].

     1) Лад и тональность: как уже было рассмотрено ранее, мелодии, сыгранные в минорной или мажорной тональности, будут иметь разный характер. В то же время, взятие отдельных нот, не соответствующих то-нальности всей мелодии и композиции в целом вызывает у слушателя ощущение напряженности.

     2) Тяготение и разрешение: поскольку мелодия существует в контексте лада и тональности, к ней применима концепция устойчивых и неустойчивых нот, которая подробно рассматривается в теории музыки. Любое гармоническое движение стремится разрешиться в определенные так называемые устойчивые ступени звукоряда. Чем больше неустойчивых ступеней используется в мелодии и чем дольше не происходит возвращения мелодии в одну из устойчивых ступеней, тем сильнее возрастает напряженность.

     3) Восходящее и нисходящее движение: экспериментальные исследования показали, что в самом общем случае мелодии с преимущественно нисходящим движением (то есть, с постепенным уменьшением высоты тона) вызывают эмоции с более низкой валентностью, а восходящее движение ассоциируется с менее положительными эмоциями.

     4) Регистр: с целью выяснить, влияет ли на настроение в музыке регистр, в котором исполнена мелодия, был проведен эксперимент в предположении, что сыгранные в более низком регистре мелодии звучат более агрессивно, угрожающе и властно – то есть, ассоциируются с негативными эмоциями, а как мелодии в высоком регистре соотносятся с более положительными эмоциями.

     Для этого были выбраны 36 мелодий разных жанров и музыкальных культур, в том числе народные и духовные песнопения. Песни были подобраны так, чтобы они были как можно менее знакомы участникам эксперимента.15 мелодий были в мажоре, 10 в миноре; 8 модальных и 3 атональных или исполненных в смешанных ладах.

     Исходные мелодии были немного транспонированы, чтобы избежать преобладания одной тональности. В ходе эксперимента каждая музыкальная фраза была представлена в трех разных регистрах: нормальный (1), транспонированный вверх на 12 полутонов (2) и транспонированный вниз на 12 полутонов (3). В общем было представлено 108 образцов (36 фраз в 3 разных регистрах). Чтобы уменьшить или обнаружить влияние тембра, мелодии были разделены на две группы, одна включала в себя чистые синусоидальные тоны, а другая – синтезированный звук пианино. Мелодии каждой из групп проигрывались в случайном порядке для каждого участника, причем на каждые восемь фраз ни одна не повторялась.

     Каждый участник проходил эксперимент отдельно. Музыкальные фразы прослушивались через стереонаушники, звуки генерировались MIDI-синтезатором. Оценка тестовых сигналов производилась по семи-балльной шкале. Каждой мелодии нужно было присвоить один из следующих тегов: агрессивный, угрожающий, тяжелый, вежливый, робкий, покорный.

     По результатам проведенного эксперимента выяснилось, что мелодии, сыгранные в верхнем регистре, оцениваются как намного более положительные, а также менее агрессивные и, в некоторой степени, робкие. Разумеется, разные мелодии сами по себе ассоциируются с разными эмоциями. Так, какие-то мелодии были оценены как более агрессивные или более вежливые по сравнению с другими независимо от регистра. Разница между двумя мелодиями с наиболее выдающимися оценками по каждой категории намного больше, чем разница, вызванная другими факторами. Другими словами, кроме высоты тона и тембра существуют более влиятельные факторы, которые связаны со структурой мелодии.

     Что касается воздействия тембра, при оценке тяжести и робости высота тона оказывала намного большее влияние на синусоидальные сигналы, чем на звуки пианино. При этом, такой связи не замечено для агрессивности и скромности.
После тестов участников попросили описать, на что они опирались, оценивая мелодии. Девять участников ответили, что делали выбор интуитивно, не полагаясь на какие-то определенные стратегии. Другие определили множество факторов, повлиявших на их выбор: степень хроматичности, мажорный или минорный лад, длительности нот, темп, ритм, тональность/атональность, стиль. Кто-то полагался даже на личные предпочтения.

     Одиннадцать участников отметили влияние на их суждения лада (мажор или минор). Восемь человек ответили, что важными были темп и длительности, причем медленные мелодии звучали менее агрессивно. Это показывает, что при распознавании настроения в музыке необходимо учитывать множество параметров сразу, поскольку их влияние проявляется в совокупности.

     Гармония. Некоторые исследователи делят гармонию на вертикальную и горизонтальную.Под термином вертикальная гармония при этом понимают отдельные аккорды – три или более одновременно звучащих нот.Горизонтальную гармонию представляют при этом гармонические последовательности – т.е. изменения высоты тона во времени, последовательности нот. Рассмотрим их по-отдельности.

     а) вертикальная гармония.С точки зрения психоакустики, аккорды воспринимаются больше как единое целое, чем как несколько отдельных тонов. Так как отдельные аккорды являются частью гармонических последовательностей, очевидно, что имеет место их совокупное воздействие.

    Основной парадигмой в изучении восприятия отдельных аккордов являлся вопрос восприятия консонанса и диссонанса, который также связывался с эмоциональными характеристиками этих аккордов. Предполагают, что отдельные аккорды оцениваются на основе сенсорного консонанса, в то время как гармония видится когнитивным процессом более высокого порядка.

     Был отмечен и эффект, оказываемый различными музыкальными интервалами и их соотношениями в аккордах, а также влияние горизонтальной гармонии на восприятие вертикальной.

     Наконец, на восприятие аккордов влияют и ожидаемость. К примеру, группа одновременно представленных звуков вызывает у слушателя ожидание какого-то более или менее вероятного последующего сочетания звуков, «sound term». Или, например, доминантсептаккорд вызывает сильное ожидание услышать следующим аккорд от тоники даже при отдельном прослушивании вне музыкального контекста. Эта особенность закладывается с детства и зависит от музыкальной культуры (поэтому западному слушателю музыка Востока поначалу кажется непривычной, а порой и сложной для восприятия, и наоборот; однако новые «правильные» и ожидаемые музыкальные паттерны запоминаются и во взрослом возрасте).

     Участникам одного эксперимента было предложено оценить отдельные аккорды (трезвучия и септаккорды с обращениями, которые были сыграны по отдельности и не включены в музыкальную фразу) по 9-тибалльной шкале эмоций, построенной на основе имеющихся исследований в области музыки и эмоций. Хотя основные категории эмоций (радость, печаль), пожалуй, наиболее просты для распознавания, использование только их не может описать более тонкие нюансы вызываемых эмоций. Эмоции, вызываемые музыкой, обычно проявляются в смешанном виде и могут обладать как положительными, так и отрицательными качествами, примером может служить чувство ностальгии.

     Наиболее заметным оказалось влияние на воспринимаемые эмоции тембра - особенно для ностальгичности и меланхоличности, причем аккорды, сыгранные на струнных инструментах, показали более высокие значения, чем сыгранные на пианино. Особенно значительны эти отличия для ностальгичности. Струнные инструменты, хотя и в меньшей мере, также показали более высокие значения нежности, в то же время, сыгранные на пианино аккорды были оценены как более радостные.

     Как оказалось, даже отдельно взятые аккорды обладают эмоциональной окраской. Причиной этому могут быть как особенности, привитые культурной музыкальной средой, так и психоакустические. В частности, восприятие эффектов консонанса и диссонанса закладывается у человека с раннего детства и возникает уже на уровне периферической слуховой системы. Чтобы понять, какие акустические особенности аккордов влияют на их эмоциональную окраску, были оценены значения параметров, которые составляют основу при оценке тембра и настроения в музыке: неравномерность спектра, яркость, изменения спектра во времени и время атаки. Однако явной связи между акустическими особенностями аккордов и большинством эмоциональных категорий обнаружено не было. Исключения составили только ностальгичность и нежность, показавшие значительную корреляцию с яркостью, неравномерностью, временными изменениями спектра и временем атаки.
 
     б) горизонтальная гармония. Горизонтальная гармония – последовательность аккордов – еще один важный фактор, влияющий на настроение в музыке. Изменив аккомпанемент, можно заставить слушателя воспринять одну и ту же мелодию по-другому. Но даже сами по себе различные комбинации следующих друг за другом аккордов и созвучий способны создать настроение.

     Основной проблемой при изучении воздействия последовательностей аккордов на эмоциональное содержание музыки, как и в случае мелодии, является то, что всевозможных комбинаций – бесчисленное множество, и изучить абсолютно все варианты, пожалуй, не представляется возможным. Но в случае горизонтальной гармонии действует уже рассмотренное выше для случая мелодии свойство «ожидаемости» звуковых событий. Слушатель всегда ожидает разрешения последовательности в устойчивый аккорд, и это ожидание сопровождается усилением эмоций с высокой напряженностью, а иногда и возбуждением.

     Как показали исследования, все ключевые параметры музыки: темп, ритм, тембр, гармонические параметры (изменения высоты тона во времени и звуковысотные отношения), влияют на эмоциональную составляющую музыки не только сами по себе, но и в совокупности, что создает значительные трудности для точного анализа музыкальных произведений с точки зрения настроения.

     Анализ каждого параметра показал, что существуют достаточно четкие зависимости между величинами, характеризующими эти параметры, и настроением, воспринимаемым слушателями. Однако в настоящее время изучены далеко не все аспекты восприятия музыки, поэтому современные системы автоматического распознавания настроения в музыке зачастую дают не самый удовлетворительный результат. Поиск оптимальных решений и алгоритмов распознавания представляет собой обширную область для дальнейшего исследования и внедрения новых практических решений. Развитие вычислительной техники, появление новых способов анализа и обработки данных, а также успехи в понимании процессов восприятия открывают новые возможности как для разработчиков систем распознавания в музыке, так и для пользователей [171-173].
 
     Проведенный анализ, в основном был направлен на выявление влияния отдельных составляющих музыки. Однако следует помнить, что музыка – явление чрезвычайно многогранное и, как утверждает гештальтпсихология, восприятие целого отнюдь не эквивалентно восприятию частей.


Рецензии