
Possiamo fidarci delle nostre orecchie?
Di Emilio Giovenale
Dopo la vista, l’udito è probabilmente il “senso” più importante per la percezione del mondo che ci circonda. Ma come tutti i sofisticati meccanismi sensori, anche in questo caso sia il sistema di percezione che quello di elaborazione del segnale percepito, possono essere tratti in inganno, generando le cosiddette “illusioni acustiche”. Le modalità con cui percepiamo, elaboriamo ed interpretiamo il segnale sonoro sono oggetto di studio della disciplina che prende il nome di “psicoacustica”. Uno degli esempi più noti di applicazioni recenti della psicoacustica è legato alle tecniche di compressione del segnale, che vengono utilizzate per esempio per ridurre le dimensione dei file digitali che contengono materiale audio, come i file mp3 per la musica.
Questi algoritmi di compressione sono detti “lossy”, perché nel processo si perde parte dell’informazione, ma si riduce la dimensione del file. La psiocoacustica aiuta a capire quale parte di informazione sia possibile perdere senza “rovinare” l’esperienza di ascolto, identificando il materiale “sacrificabile”.
Le illusioni acustiche
La psicoacustica ci dice che la fisiologia del nostro sistema uditivo, ed in particolare le operazioni che il nostro cervello compie per analizzare il segnale che proviene dalle nostre orecchie, possono andare oltre la semplice rappresentazione “fisica” del suono come un’onda, interagendo con tutta una serie di altri meccanismi cerebrali. Questi processi sono in genere orientati a conferire all’individuo un vantaggio evolutivo, ma possono produrre dei fenomeni di alterazione della percezione, che è utile studiare per capire meglio come funziona il nostro cervello.
Parlo delle cosiddette “illusioni acustiche”, fenomeni analoghi a quelli delle ben più famose “illusioni ottiche”, ma assai meno studiati, anche se nell’ultimo periodo un crescente numero di ricercatori nel campo delle neuroscienze si è interessato a questi fenomeni.
Innanzitutto, quando si parla di illusioni acustiche è necessario distinguere tra quelle che coinvolgono i “sensori” del nostro apparato (fondamentalmente l’orecchio) e quelle che sono causate invece dall’elaborazione che il nostro cervello fa del segnale che proviene dal sensore. Una analoga distinzione è ben nota nel campo delle illusioni ottiche: per esempio la saturazione dei sensori della retina è la causa dell’illusione ottica qui sotto rappresentata.

Nella figura i pallini viola si spengono in sequenza lungo il cerchio. Se si guarda l’immagine tenendo lo sguardo fisso sulla crocetta, al posto del pallino rosa appare un pallino verde, che in realtà non esiste. Tenendo lo sguardo fermo, la luce colpisce sempre le stesse cellule della retina, la cui risposta all’impulso viola “satura”, quindi quando il pallino scompare, e al suo posto resta lo sfondo bianco, appare il colore complementare verde (perché verde + viola = bianco). È lo stesso fenomeno che si verifica quando fissiamo per diversi secondi una fonte di luce molto intensa, e poi chiudiamo gli occhi… e vediamo una “immagine negativa” della fonte di luce.
Il terzo suono di Tartini
Un esempio di illusione derivante da un problema di sensore, nota da secoli, è il cosiddetto “terzo suono di Tartini”. Quando si suonano due suoni molto intensi (e possibilmente ricchi di armonici), quando questi due suoni arrivano simultaneamente all’orecchio, noi percepiamo un terzo suono, in genere corrispondente ad una frequenza pari alla differenza tra quelle dei due suoni originali (quindi in genere più grave). In realtà questo terzo suono “non esiste” all’esterno del nostro corpo: se utilizziamo un microfono per cercare di rilevarlo non troviamo nulla.

Questo perché in realtà questo suono viene prodotto all’interno del nostro orecchio. Si tratta di un fenomeno di fisica non lineare: quando due onde di ampiezza elevata interagiscono all’interno del nostro sistema uditivo, la sua struttura fa si che vengano generate onde ad una frequenza pari alla differenza delle frequenze delle due onde originarie (e anche alla frequenza somma).
La storia…

Questo fenomeno si chiama terzo suono di Tartini, perchè evidenziato nel 1714 dal violinista Giuseppe Tartini all’inizio del XVIII secolo, anche se con ogni probabilità era conosciuto già prima.
Egli scoprì che se sul suo violino, perfettamente intonato, si producevano contemporaneamente due suoni a un intervallo di quinta, ossia con rapporto 3:2 (bicordo), automaticamente era udibile anche un terzo suono, di minima intensità, con una frequenza ben determinata, un’ottava sotto la nota più bassa.

Il fenomeno era già conosciuto almeno dal XVI secolo e veniva sfruttato principalmente nell’arte organaria, in modo da poter dare agli strumenti una maggiore estensione nel basso senza dover costruire canne eccessivamente lunghe e costose.
Ci sono invece illusioni che derivano dal modo in cui il nostro cervello interpreta l’informazione sonora. Per capire come funzionano i principali meccanismi dobbiamo considerare come sono composti i suoni che vengono naturalmente emessi, e di conseguenza quello che il nostro cervello “si aspetta”, per poi interpretarlo.
Fondamentale e armonici
In natura non esiste un suono “puro”, composto cioè da un’onda che oscilla ad una singola frequenza, assimilabile ad una sinusoide pura. Ogni volta che viene generato un suono, insieme alla frequenza principale (che si chiama “fondamentale”), vengono emessi tutta una serie di “armonici”, cioè di multipli n della frequenza fondamentale, con ampiezze variabili e in genere meno intensi della fondamentale. La composizione di questi armonici segue le leggi della scala pitagorica: l’armonico con n=2 è a distanza di un’ottava sopra la fondamentale, quello con n=3 un’ottava più una quinta, n=4 due ottave, n=5 due ottave più una terza maggiore, e così via…
La ampiezza relativa di questi armonici contribuisce a definire il “timbro” degli strumenti musicali, che rende diverso il suono di un violino da quello di un sassofono. Ora il nostro cervello, quando sente un suono, per identificarlo in termini di frequenza e timbro, tende a “cercare” la fondamentale, perché in natura è la componente più rilevante del suono stesso. Se noi costruiamo un suono e lo priviamo della fondamentale, lasciando però gli altri armonici nella corretta proporzione, confondiamo il cervello, che come reazione “cerca” di ricostruire un suono naturale “inventando” la fondamentale.
La fondamentale mancante
Se ascoltate queste due sequenze di suoni la melodia sembra la stessa: Do3-Re3-Mi3-Fa3-Sol3-Sol2-Sol1-Sol0. Una scala ascendente da Do a Sol, e poi la ripetizione del Sol per altre 3 volte, ogni volta una ottava più in basso
Ascoltandola l’impressione è quella che si tratti della stessa melodia, con le stesse note, ma suonata da due strumenti diversi (il secondo con un timbro più acuto «metallico»). In realtà la seconda sequenza è fatta con gli stessi suoni della prima, dai quali è stata eliminata la frequenza fondamentale, che è quella che dovrebbe farci riconoscere l’altezza del suono!!! Eppure, anche senza fondamentale, non esitiamo a riconoscere che le note sono le stesse!
Come mai l’illusione funziona? Se tolgo la fondamentale dovrei sentire la prima armonica, un’ottava più in alto e quindi sentire una sequenza con le note spostate verso l’alto, ma questo non succede!
Perchè funziona?

Il motivo è semplice: le armoniche sono tutte multiple della fondamentale, per cui se considero la prima nota, che è un Do3 a 131 Hz, la sua seconda armonica si trova a 262 Hz, la terza armonica a 393 Hz e così via.
Se elimino la fondamentale resta la seconda armonica a 262 Hz, e la terza a 393 Hz CHE PERO’ NON E’ UN MULTIPLO DI 262 Hz! Quindi il cervello fatica a interpretare i 262 Hz come fondamentale (Do4), perché si aspetterebbe di sentire il suo primo armonico a 525 Hz, invece trova 393 Hz (che non è un Do, ma un SOL4, a distanza di 5a dalla fondamentale. In questa situazione, preferisce «ricostruire» un suono naturale “inventando” la fondamentale mancante a partire dai suoi armonici.
La cosa più interessante è che la fondamentale dell’ultima nota (il Sol0) ha una frequenza di 24,50 Hz, che per essere emessa ha bisogno di un altoparlante di qualità particolarmente buona: se usate l’audio di un PC o di un cellulare, o delle cuffiette, queste non emetteranno mai un suono ad una frequenza così bassa… ma il nostro cervello la ricostruisce a partire dagli armonici (in entrambe le sequenze). In pratica sentiamo un suono che non è mai stato emesso!
Il paradosso del tritono
Usare suoni elaborati può confondere il nostro cervello: in genere se si fa sentire ad un ascoltatore una sequenza di due suoni, è per lui facile dire se il secondo è più acuto o più grave del primo (nel linguaggio musicale si parla di intervallo ascendente o discendente). In certi casi però è possibile mettere in difficoltà questa capacità elementare, con la cosiddetta “illusione del tritono”
Se si fanno ascoltare queste coppie di note ad una vasta platea, si osserva che non c’è concordanza nel definire gli intervalli ascendenti o discendenti: alcuni li interpretano in un modo ed alcuni in un altro.

Perché questo accade? Il tritono è un intervallo formato da 3 toni e mezzo (su un pianoforte i due tasti distano 7 posizioni, inclusi i tasti neri), che è pari esattamente a mezza ottava.
Per cui se la nota di partenza è un La#, l’intervallo ascendente ci porta al Mi dell’ottava superiore, quello discendente al Mi dell’ottava inferiore, MA E’ SEMPRE UN MI! Se prendo una nota qualsiasi, il tritono al di sopra ed il tritono al di sotto corrispondono esattamente alla stessa nota, suonata su due ottave differenti.
Il suono di Shepard
Già questo fatto confonde il nostro cervello. Se poi “lavoriamo” in maniera artificiale il secondo suono l’effetto confondente aumenta. Infatti invece di suonare un “MI” normale, ciò che facciamo è usare un suono “costruito a tavolino”, il cosiddetto Suono di Shepard, dal nome dello psicologo esperto in scienze cognitive che ha studiato per primo questi fenomeni.

Il suono di shepard è costituito da più frequenze distribuite ad un’ottava di distanza una dall’altra con ampiezze distribuite con una distribuzione gaussiana, come in figura.
Nella figura la barretta rossa rappresenta il primo suono, mentre il secondo suono è la somma delle barrette blu. È evidente che stiamo imbrogliando: la seconda nota è la somma di tanti Mi. L’ascoltatore è confuso dalla sequenza che non segue la serie armonica (e quindi fatica a trovare la fondamentale) e sente invece entrambi i Mi, quello sopra e quello sotto la nota di partenza. Il suo cervello a questo punto decide “a caso” la ottava della seconda nota, e per questo l’intervallo è percepito diversamente da persone differenti.
Qui potete trovare approfondimenti sul paradosso del tritono…
La scala infinita di Shepard
Il suono di Shepard interviene anche in una illusione che è decisamente più spettacolare: la cosiddetta Scala infinita di Shepard: ascoltate questi suoni (il file è da 5 minuti, ma bastano pochi secondi):
La sensazione è che il suono salga (o scenda) all’infinito… ovviamente non è così. Anche questo è un “trucco” legato alla peculiare struttura timbrica del campione sonoro utilizzato. Si tratta anche qui del suono di Shepard descritto in precedenza. Le barre azzurre rappresentano le frequenze che lo compongono, tutte a distanza di un’ottava una dall’altra.


Quando il suono inizia a salire le barre scorrono verso destra (acuti). Le frequenze più acute si attenuano e quelle più gravi si rinforzano, e dopo lo scorrimento di un’ottava ci troviamo di nuovo nella situazione di partenza: Il nostro cervello però ha sentito salire il suono, e se mettiamo in loop il campione abbiamo l’impressione di una salita infinita.

Di fatto questa illusione acustica, come funzionamento è l’equivalente dell’illusione ottica dell’insegna del barbiere, e come effetto è equivalente alla scala di Penrose, descritta nel 1958 dai matematici inglesi padre e figlio Lionel e Roger Penrose.
Qui trovate approfondimenti sulla struttura “circolare” che permette l’effetto della scala di Shepard
Uso della scala di Shepard nella musica…
In realtà questi “giochetti” erano ben noti ai musicisti: basta ascoltare questo brano per organo di Bach. Si sentono distintamente la linea di basso che scende all’infinito e gli accordi acuti che contemporaneamente salgono. L’organo è lo strumento ideale per questi effetti, grazie alla sua ricchezza timbrica, con molti armonici.

Bach non è stato l’unico a usare questi effetti… ascoltate questo frammento della canzone «Teo Torriatte» (Let us cling together) dei Queen, tratta dall’album «A day at the races» del 1976:
… e nei film e nella TV
Ci sono altri esempi di utilizzo della scala di Shepard. Uno di questi lo troviamo nel famoso videogame «Super Mario», dove un livello comprende una «scala infinita» che Mario deve percorrere… e non a caso la colonna sonora è proprio una variante della scala di Shepard!
Un altro esempio è la colonna sonora del film «Il cavaliere oscuro», dove il regista, Chris Nolan, noto per la attenzione alla componente audio dei suoi film, utilizza la scala di Shepard in modalità «continua» come «rumore» prodotto dalla moto di Batman, a esaltare la sensazione di «accelerazione».
Anche nella popolare trasmissione “Amici” la scala di Shepard viene utilizzata per sottolineare un momento di suspense…
L’illusione ritmica di Risset
In realtà esiste un’altra illusione che è l’analogo della scala di Shepard, ma che, invece che sul timbro, gioca sul senso del ritmo… ascoltate bene (anche qui bastano pochi secondi):
Sembra che la sequenza acceleri all’infinito… anche qui il “trucco” è analogo al precedente: ci sono due strutture ritmiche sovrapposte, una a velocità doppia dell’altra. Si aumenta il tempo di entrambe simultaneamente, e pian piano si abbassa il volume di quella più rapida, mentre si aumenta il volume di quella più lenta. Nel contempo dal basso entra una terza sequenza da basso volume con ritmo dimezzato rispetto alla seconda, finché la prima scompare, la seconda prende il posto originario della prima e la terza prende il posto originario della seconda… e siamo tornati al punto di partenza. Mettendo il tutto in loop si ha l’effetto desiderato.
Come trasformare un’illusione in un’opera d’arte
Questo tipo di effetto è stato usato, in maniera probabilmente inconsapevole, a giudicare dall’intervista rilasciata dall’autore sull’argomento, dal compositore della colonna sonora del film “Hoppenaimer”, Ludwig Goransson. Nel brano a partire dal secondo 50, ci sono incrementi di velocità continui, associati a raddoppi della struttura ritmica sottostante, che ricordano molto da vicino la struttura elaborata da Risset.
La cosa più entusiasmante è che l’autore sia riuscito a trasformare questi cambi ritmici in un opera di elevato valore artistico, che suscita sorpresa ed emozioni forti. E la cosa anche da un punto di vista tecnico non deve essere stata affatto facile: far suonare ad un ensemble vero di 24 elementi, dal vivo, una partitura del genere è una sfida ai limiti del possibile, e l’autore ci spiega come ci sia riuscito nell’intervista che potete trovare qui.
Nella parte due troverete altre illusioni che esplorano il modo in cui il nostro cervello elabora l’informazione, l’effetto Mc Gurk, la melodia nascosta, l’esperimento sulla memoria a breve termine per la melodia, e la stupefacente “illusione del canto”. E mentre esamineremo questi fenomeni parleremo anche dell’orecchio assoluto e di come questo sia collegato ai meccanismi neurologici che regolano l’apprendimento del linguaggio.
Commenti recenti