L’audio tridimensionale in ELETTRO ACQUA 3D

La veste sonora di Elettro Acqua 3D è frutto di una ricerca che si è sviluppata in più campi convergenti, sia nei brani che nelle “espansioni”.

Al di là dell’aspetto compositivo, nei brani abbiamo ricercato delle sonorità attinenti all’ambientazione geografica/emotiva evocata dal testo del brano.

Ripercorrendo idealmente la storia degli strumenti elettroacustici, abbiamo fornito a ogni canzone una caratterizzazione timbrica, con l’utilizzo degli stessi strumenti elettroacustici, ma anche con quelli elettronici, analogici e digitali.

Nelle “espansioni” la  ricerca ha avuto come campo d’indagine l’ascolto immersivo e la ricostruzione di uno spazio ambientale/sonoro in cui inserire gli eventi musicali, intendendo per “eventi musicali” sia i suoni che i rumori.

L’ambientazione è stata costruita utilizzando suoni campionati, riprese ambientali (nell’effettivo luogo di ambientazione, come nel caso dei suoni della savana, dei rumori di Milano, ecc.) e suoni di sintesi, che consentissero una mimesi tra il suono reale e il suono ricostruito, tra l’ambientazione effettiva e la costruzione di un mondo sonoro immaginario ed evocativo.

Le “espansioni” sono state mixate utilizzando varie tecniche di “mixaggio binaurale” e VR (Virtual Reality audio)

Schermata 2018-07-11 alle 22.02.15
Panning binaurale.

Cenni tecnici sull’audio 3D

I primi studi sulla ricezione binaurale sono antecedenti agli anni ’20 del secolo scorso. Risalgono agli esperementi effettuati da G.W.Stuart e dalla coppia di studiosi Hartley & Fry, studi pubblicati sulla rivista Physical review, rispettivamente nel maggio del 1920 e nel dicembre del 1921.
 
Sono citati in un fondamentale testo di psicoacustica, sebbene incentrato prevalentemente sul parlato che è Speech and hearing in communication di Harvey Fletcher, direttore dei Bell Telephone laboratories
Il capitolo 12  di questo testo, pubblicato nel 1953, riporta numerosi esperimenti di localizzazione tramite l’uso di cuffie, cornette telefoniche e stetoscopi: già a quell’epoca erano comprovati sperimentalmente gli effetti della differenza di fase e di intensità per la localizzazione dei suoni (sia toni semplici come sinusoidi, sia suoni complessi); nonchè l’esistenza dei “battiti binaurali”.
Le prime applicazioni pratiche di questi studi si ebbero durante la seconda guerra mondiale in cui si progettarono sistemi per la localizzazione degli aerei e dei sommergibili nemici tramite ripresa sonora con doppio microfono montato su una struttura simile a una testa, collegato a una cuffia.

A partire dai primi sistemi di riproduzione audio monocanale si è passati agli impianti stereo negli anni ’70, quindi alla diffusione del multicanale (5.1 e sourround) nei cinema e negli home-theatre; mentre in ambito accademico si affermava lo standard ambisonic per la diffusione della musica da più punti-sorgente. 

Il frontespizio di “Speech and hearing in communication” di Harvey Fletcher.

I sistemi multicanale permettono la localizzazione spaziale della provenienza del suono (sia statica che dinamica) e la ricostruzione dell’ambiente circostante.
Ciò avviene attraverso differenze di volume, differenze di filtraggio, effetto doppler, riverberi, ecc. La debolezza di questo sistema consiste nel fatto che esiste un unico punto ideale per l’ascolto (es. in centro alla sala del cinema), e il suono risente comunque dello spazio in cui sono inseriti i diffusori audio.

A partire dalla metà del secolo scorso si è cominciato a studiare la modalità di ricezione del suono, delle orecchie umane tramite l’utilizzo di “Dummy Head”: un modello di testa e orecchie umane, comprensive di padiglioni auricolari e condotto uditivo. All’interno delle cui orecchie sono inseriti due microfoni che captano il suono.

Si sono studiate quindi delle funzioni di trasferimento chiamate HRTF (head related transfer function), che simulano la percezione delle due orecchie umane, le quali localizzano i suoni attraverso differenze di fase e di intensità, e differenza dello spettro, dovuta al filtraggio dei padiglioni auricolari (oltre al torso e alla testa). In questo modo il cervello umano riesce a codificare la provenienza del suono nello spazio tridimensionale (Azimuth, raggio, elevazione).

Il cervello riesce altresì a codificare, attraverso la modalità di percezione del suono, anche il tipo di ambiente in cui è inserito, con principalmente tre parametri: grandezza, forma, dimensioni (un luogo aperto, una piccola stanza, una chiesa, uno stadio, una caverna, ecc.).

É anche da menzionare l’effetto denominato simpaticamente “cocktail party”, grazie al quale riusciamo a “isolare” un suono che ci interessa dal brusio circostante (la voce di un interlocutore nel vociare di un party).

Attraverso queste funzioni di trasferimento HRTF, che possono essere applicate a materiale sonoro-musicale per simulare la localizzazione spaziale, unite ad altri accorgimenti quali l’uso dinamico dei riverberi stereo, doppler effect, panning tradizionale, si riesce a ricostruire una ambientazione tridimensionale.

Schermata 2018-07-11 alle 22.03.32
Dummy head.

La cuffia e gli auricolari permettono di eliminare completamente l’effetto ambientale e di offrire un ascolto “perfetto” e personale.

La sintesi sonora in Elettro Acqua 3D

Nelle intro-espansioni ho utilizzato diverse tecniche, sia di generazione che di manipolazione del suono.
Ho utilizzato suoni campionati, registrazioni ambientali di alta qualità, registrazioni estemporanee fatte col cellulare. Ho generato suoni utilizzando principalmente due software: Csound e MaxMSP, principalmente con modulazione di frequenza, wave terrain, sintesi sottrattiva e modelli fisici (Karplus-Strong).

Schermata 2018-07-11 alle 22.22.40
Il suono introduttivo di Sirene in Csound.

I suoni sono stati elaborati con algoritmi di stretching e pitch shifting combinati con la granulazione, con l’applicazione di effetti, con morphing e convoluzione, delay, echi e riverberi, ecc.

Si è prestata molta attenzione alla creazione di una ambientazione sonora coerente e immersiva in cui i vari personaggi/timbri/suoni si potessero muovere dando un forte senso di spazialità e tridimensionalità.

Le espansioni (pur essendo brani acusmatici di per sé compiuti) preparano l’ascoltatore e lo accompagnano da un brano all’altro con suoni caratteristici (la città, la savana, le esplosioni, ecc.), preparando così il clima emotivo della canzone che segue.

Spesso nelle intro sono nascosti/camuffati alcuni suoni dei brani per dare coerenza strutturale e timbrica ai vari episodi.

La presenza di suoni reali e ricostruiti, porta l’ascoltatore a percepire il fatto sonoro, sia collegandolo alla sorgente originaria, sia come timbro puro, come personaggio sonoro.

La differenza dei piani sonori porta l’ascoltatore a dimenticare il medium di trasmissione del suono (la cuffia), fino a portarlo a una completa immersione nel contesto.

Schermata 2018-07-11 alle 22.22.29
L’espansione di Sette metri sotto il suolo in MaxMSP.

iOS LINK

https://itunes.apple.com/us/app/elettro-acqua-3d/id1411416322

Android LINK

https://play.google.com/store/apps/details?id=it.marcodinoia.elettroacqua3d

  • Facebook
  • Twitter
  • email
  • Google Bookmarks
  • Google Buzz
  • Tumblr
  • Yahoo! Buzz
  • RSS