L’organo vocale può essere considerato per ciascuna persona uno strumento musicale primordiale. Alla voce si ricollega l’originaria capacità individuale di emettere un suono, fin dai primi istanti di vita. Pur non essendo educati alla musica o alla recitazione, dell’organo vocale si sperimentano quotidianamente le grandi potenzialità comunicative ed espressive: dalla lingua parlata al canto, dall’imitazione del rumore ambientale alla manifestazione di gioia/disappunto individuale. La compromissione della capacità vocale costituisce nell’uomo una grave forma di menomazione, cui si ricollega la stessa percezione uditiva.

L’apparato vocale è quindi uno straordinario medium espressivo oltre che comunicativo, capace di conferire al significato semantico del linguaggio una particolare carica emotiva: la voce come specchio delle più profonde emozioni della persona, indicatore di uno stato d’animo o di una ottimale/precaria condizione psicofisica. Non sarà un caso che nella lingua tedesca il termine “stimme” identifichi il significato di voce, intesa anche come “parte musicale”, linea melodica; il termine derivato, “stimmung”, identifica però il significato di umore, stato d’animo, disposizione interiore, sottolineando il potenziale espressivo insito nell’emissione vocale. Queste caratteristiche fanno della voce una fonte sonora ancora oggi difficilmente riproducibile artificialmente, forse proprio perché caratterizzata da potenzialità espressive maggiori e più complesse rispetto agli altri strumenti musicali. Scopo principale di queste note vuole essere proprio la comprensione della relazione tra espressività e timbro vocale, una caratteristica notoriamente legata alla nozione di “colore” e “carattere” del suono ma cui spesso si ricollega anche ogni reazione emotiva individuale.

Il meccanismo della fonazione

L’organo vocale è uno strumento che consiste in un generatore di potenza (i polmoni), un oscillatore (le corde vocali) e un risuonatore (laringe, faringe e bocca). I cantanti modificano l’assetto del risuonatore in modo speciale” J. Sundberg

Il funzionamento dell’organo vocale nell’uomo – l’insieme degli organi fonatori del tratto vocale: polmoni, trachea, laringe, corde vocali, cavità orale, cavità nasale– si lega fondamentalmente all’emissione di componenti sonore elementari, i foni, da cui deriva la generazione dei fonemi e da questi la formazione delle sillabe e delle parole che fanno parte di ogni lingua parlata. I foni possono essere distinti in sonori e sordi: nel primo caso sono prodotti mettendo in vibrazione le corde vocali con un meccanismo anatomico noto come meccanismo laringeo; nel secondo caso sono generati dal solo flusso d’aria proveniente dai polmoni e sospinto verso l’esterno. Nel caso dei foni sonori si parlerà di suono vero e proprio; per i fonemi sordi si tratterà invece sostanzialmente di una forma più o meno articolata di rumore, un fenomeno acustico cui manca un’altezza precisa, generata da una qualche forma di deviazione del flusso d’aria all’interno del tratto vocale. Nella lingua italiana, ciascuno di noi può sperimentare come l’emissione delle vocali, per quanto breve essa sia, coinvolga sempre la vibrazione delle corde vocali. Al contrario, l’emissione delle consonanti si associa solo ad una forma di occlusione del flusso d’aria (in particolare la parte terminale del tratto vocale, con il coinvolgimento della lingua, delle labbra e dei denti) che può dar vita a diverse modalità di articolazione sonora. Possono essere generati suoni occlusivi ((p, b), fricativi (f, v, s), affricati (z, c), nasali (n), laterali (l). E, analogamente, l’assenza di vibrazione delle corde vocali nell’emissione parlata, può essere sperimentata facilmente “sussurrando” le parole, quella modalità di emissione che ci consente di articolare le sillabe con la sola fuoriuscita dell’aria, rinunciando al consueto sostegno della vibrazione delle corde vocali. Ma volendo ora identificare più nel dettaglio il meccanismo laringeo – fisiologicamente, l’azione dalla quale si origina l’emissione vocale, nel canto come nel parlato – va sottolineato che il movimento delle corde vocali non sia propriamente equiparabile alla vibrazione di una corda musicale. Pur essendo vincolate e tese tra due estremità (anteriormente la cartilagine tiroide e posteriormente le cartilagini aritenoidi), le corde vocali non possono essere messe in vibrazione secondo quelle modalità che sarebbero consuete per gli altri strumenti musicali (sfregamento, percussione, pizzico), né il solo flusso d’aria prodotto dai polmoni sarebbe in grado di causare una loro oscillazione acusticamente apprezzabile. Il suono vocale ha invece origine nell’attitudine delle corde vocali di avvicinarsi e distanziarsi reciprocamente in modo ciclico – ciò che frequentemente si definisce accollamento delle rime della glottide – chiudendo e aprendo la sommità del condotto della trachea e generando così, sotto la spinta del fiato, una successione periodica di sbuffi d’aria. Analizzando più in dettaglio questo meccanismo, si può notare che, fisiologicamente, la natura dello sbuffo d’aria debba essere ricollegato alla tensione delle corde vocali, alla velocità del flusso d’aria e alla contestuale diminuzione di pressione dell’aria presente al di sotto della glottide. Ma al di là della descrizione movimento delle corde vocali sotto il profilo fisico-meccanico, è interessante notare come il loro avvicinamento possa coinvolgere una porzione più o meno consistente di tessuto (mucosa cordale), generando, durante la fonazione, in ogni caso un movimento ciclico detto onda mucosa. L’andamento periodico del meccanismo laringeo genera quindi, al di sopra della glottide, una successione di compressioni e rarefazioni gassose che si propaga lungo tutto il tratto vocale, in altri termini ciò che identifica da un punto di vista acustico un’onda sonora longitudinale, caratterizzata da altezza e intensità musicale ben definite.

In questo senso l’emissione vocale può essere equiparata alla produzione sonora negli strumenti musicali a fiato, ad imboccatura labiale in particolare. Esiste, infatti, una sostanziale analogia tra le corde vocali del cantore e le labbra dell’esecutore. Entrambi gli elementi vibranti costituiscono un oscillatore elementare il cui movimento, prolungato per il tempo di esecuzione, consente il permanere di un’onda sonora progressiva di tipo longitudinale. E ancora, all’interno delle rispettive cavità (tratto vocale o canneggio), la sovrapposizione tra l’onda sonora progressiva e la sua riflessione all’estremità libera (campana dello strumento a fiato e labbra della bocca) genera un’onda sonora stazionaria, quel particolare moto ondoso per il quale, lungo il percorso dell’onda sonora, possono essere individuati punti fissi di massima e minima sollecitazione nel mezzo di propagazione (nel caso del tratto vocale, ventri e nodi di pressione e/o di velocità della massa d’aria che lo riempie).

Pur in tale analogia, va però evidenziata una sostanziale differenza. Negli strumenti musicali a fiato la frequenza di oscillazione delle labbra dell’esecutore, e conseguentemente l’altezza del suono emesso, è fortemente condizionata dall’onda sonora riflessa che si genera all’interno del canneggio; nel caso della voce invece, la frequenza di vibrazione delle corde vocali avviene indipendentemente, determinata solo dalla loro tensione. Nell’emissione vocale, quindi, il modo in cui si generano nodi e ventri di pressione (o velocità) dell’aria all’interno del tratto vocale non ha alcuna influenza sull’altezza del suono emesso, ma, come si vedrà, è in grado solo di influenzarne le sue particolarità timbriche .

Caratteristiche della voce: altezza, intensità e timbro

E’ noto che da un punto di vista musicale altezza, dinamica e timbro costituiscono le caratteristiche principali del suono di ogni strumento musicale, caratteristiche che da un punto di vista fisico possono essere identificate dalla frequenza, intensità e composizione spettrale del fenomeno sonoro. E’ qui il caso quindi di esaminare in che modo l’organo vocale determina tali componenti musicali, essendo ad esse legata ogni potenzialità espressiva. L’attenzione sarà qui rivolta in particolare all’emissione vocale nel canto, equiparando quindi la voce ad un autentico strumento musicale. In primo luogo è il caso di evidenziare che l’altezza ed l’intensità della voce non risultano caratteristiche del tutto indipendenti: come accade in molti strumenti musicali, il crescere dell’altezza si associa ad un naturale incremento di intensità del suono, legato alla maggiore contrazione dei tessuti epiteliali coinvolti durante la fonazione. A questo proposito, l’altezza del suono vocale si lega fondamentalmente all’allungamento/contrazione delle corde vocali. L’aumento della loro tensione, delle rime della glottide in particolare, comporta un incremento della frequenza degli sbuffi d’aria prodotti all’interno del tratto vocale e conseguentemente la generazione di onde sonore di altezza maggiore. Sotto il profilo anatomico, la tensione delle corde vocali può essere modulata sfruttando l’azione di distinti apparati muscolari:

  1. a) il muscolo vocale, con una variazione di altezza pari ad un intervallo di V (registro grave);
  2. b) i muscoli antagonisti del collo, aritenoidei e cricotiroidei, con l’estensione di un secondo intervallo di V (registro medio-acuto);
  3. c) i muscoli sternotiroidei e i muscoli dell’osso ioide, con l’estensione di un ulteriore intervallo di V (registro acuto).

L’azione combinata dei tre apparati consente quindi un’estensione globale dell’organo vocale nel canto pari a circa due VIII (poco più di una VIII nel linguaggio parlato), pur se va sottolineato che questo dato risulti variabile per ogni persona e sicuramente assoggettato allo sviluppo di una idonea tecnica di emissione vocale. Nel canto, percorrendo dal grave all’acuto l’intera estensione vocale individuale, gli apparati muscolari sono sollecitati in successione: esaurita una prima modalità di allungamento della corde vocali, entra in gioco il meccanismo successivo, modulando la voce nei vari registri. Il passaggio tra i vari registri, coinvolgendo diversi meccanismi di contrazione-estensione delle corde, non è immune da problematicità, ciò che si evidenzia spesso nella mancanza di omogeinetà sonora durante l’esecuzione dell’intera estensione vocale individuale. Ciascun cantore, ad esempio, può sperimentare che l’emissione del suono nel registro acuto comporti un progressivo abbassamento della cartilagine tiroidea (il pomo di Adamo) indotto dall’azione del terzo apparato muscolare e che spesso il passaggio a quel registro vocale coincida con una moderata discontinuità timbrica della voce.

Se l’altezza del suono vocale si riconduce alla tensione impressa alle corde vocali, l’intensità è invece determinata dalla pressione che il flusso gassoso polmonare esercita nei loro confronti. Come si è visto, quando l’atto respiratorio ordinario è accompagnato dalla chiusura del condotto tracheale, al di sotto della glottide si genera una spinta che viene contrastata dall’accostamento delle rime della glottide: maggiore sarà la forza, più esteso sarà l’accollamento delle corde vocali, coinvolgendo, in particolare, una quota maggiore del loro spessore. In generale quindi, l’intensità del suono vocale costituisce una sorta di stato di equilibrio tra la forza esercitata dal fiato e, in contrasto con tale forza, la resistenza prodotta dalla massa delle corde vocali. E va evidenziato anche che al crescere dell’altezza della voce sarà minore lo spessore del tessuto cordale coinvolto nella resistenza al flusso del fiato, essendo le corde necessariamente più tese e meno accollate. Tale particolarità sarà responsabile, come si vedrà, della differenziazione timbrica della voce nei suoi diversi registri. Diversa e più complessa appare per certi versi la considerazione del timbro vocale, essendo tale aspetto legato ad un potenziale coinvolgendo di ogni elemento anatomico dell’apparato fonatorio. Molte potrebbero essere le definizioni del timbro di un suono, ma probabilmente nessuna sarebbe in grado di tradurre in modo esaustivo l’immagine sensoriale di un particolare carattere timbrico. Sotto il profilo percettivo è possibile rilevare come il suono vocale possa apparire pieno, “a fuoco”, o, viceversa, ovattato, poco incisivo, cui si associano solitamente le definizioni di suono ben timbrato o suono privo di sufficiente carattere timbrico. Volendo stabilire una sorta di parallelismo tra il suono vocale e il suono degli strumenti musicali, della prima categoria farebbe parte il suono del violino, per la sua brillantezza ed incisività, mentre della seconda categoria farebbe parte sicuramente il suono di un flauto (dolce o traverso) per la sua rotondità e dolcezza.

Ma l’immagine acustico-sensoriale del suono musicale risponde, sotto il profilo fisico, ad una evidente connotazione acustica del fenomeno sonoro, ciò che si traduce in una maggiore o minore numerosità e intensità di suoni armonici che corredano il suono fondamentale. I suoni che ascoltiamo ordinariamente sono composti da una frequenza base, detta fondamentale, unita ad una serie più o meno nutrita di suoni accessori, detti più propriamente suoni parziali armonici, proprio per avere frequenze multiple della fondamentale. Nella figura seguente può essere notata come, data una frequenza fondamentale f1, la sovrapposizione di questa con le frequenza f2 ed f3, multiple naturali di f1, dia luogo ad un’onda sonora più articolata (suono complesso) che presenta però la stessa periodicità di f1. Le rappresentazioni che seguono evidenziano la sovrapposizione della onde sonore elementari f1, f2, f3 come andamento della pressione in funzione del tempo t e in funzione della frequenza; le rappresentazioni sono considerate complementari, evidenziando nel secondo caso la scomposizione del suono complesso nelle su e componenti elementari. Si noti come l’intensità di f1 sia doppia rispetto a quella di f2 e f3.

Fig. 2) Grafici delle onde sonore riferite alla frequenza fondamentale (f1, in rosso), alla seconda armonica (f2, in verde), alla somma di f1 e f2 (in azzurro), alla terza armonica (f3, in magenta)), alla somma delle tre componenti di (f1+f2+f3, in blu).

Il sistema uditivo è in grado di integrare tutti i contributi sonori contenuti in un suono dato, riconoscendo l’altezza del suono per mezzo della sua frequenza fondamentale ed il suo carattere timbrico per mezzo dei contributi parziali. Ogni interrogativo inerente la qualità timbrica del suono dovrà quindi valutare, sia nel linguaggio parlato come nel canto, in che modo l’apparato vocale di ciascun individuo possa essere in grado di variare la numerosità e l’intensità dei contributi parziali. Una prima osservazione deve essere riferita al fatto che la definizione del timbro della voce non possa ritenersi del tutto indipendente rispetto all’altezza e all’intensità del suono. Ciò lo si deve alla fisiologica incapacità di mantenere, in ogni porzione dell’estensione vocale individuale, lo stesso grado di accollamento tra le corde vocali. Ma venendo ad identificare, più nel dettaglio, il corredo dei parziali armonici che accompagnano nell’emissione vocale una frequenza fondamentale, è necessario evidenziare che l’andamento della pressione sonora, misurata nel mezzo di propagazione in funzione del tempo, richiama con buona approssimazione una forma d’onda di tipo “triangolare”, in cui può essere riconosciuta una serie molto numerosa di parziali armonici (nf1) che hanno un’ampiezza rapidamente decrescente al crescere della frequenza (circa – 12 dB/ottava)

Fig. 3) Andamento della pressione sonora in funzione del tempo (emissione vocale nel canto, 261 Hz) e scomposizione del suono nelle sue componenti parziali; le curve in rosso evidenziano la diversa intensità dei parziali armonici nel parlato (linea mediana) e, per l’emissione cantata, nel forte (linea superiore) e nel piano (linea inferiore)

Ciò che si può quindi osservare è che, in condizioni di emissione vocale ordinaria, la frequenza fondamentale f1 con la quale vibrano le corde vocali sia accompagnata da molte altre frequenze accessorie, multiple naturali di f1 (parziali armonici) la cui intensità sia sempre meno evidente man mano che ci si distanzia dal suono che le origina. L’intensità di tali contributi accessori decade con maggiore rapidità nell’emissione parlata (- 18 dB/ottava) rispetto a quella cantata così come, musicalmente parlando, nel piano rispetto al forte [9]. In altre parole, come può essere verificato ordinariamente da ciascun cantore, la brillantezza, l’incisività della propria voce può essere rafforzata cantando piuttosto che parlando, ovvero cantando con sonorità forte piuttosto che con un volume sonoro modesto. Ma con quale modalità altezza e intensità del suono vocale possono colorare timbricamente la voce, determinando un diverso corredo di parziali armonici associato alla frequenza fondamentale ?

In generale va rilevato che la minore intensità dei parziali armonici, cui consegue una minore caratterizzazione timbrica della voce, dipenda fondamentalmente da una diminuzione della porzione di massa cordale accollata durante la fonazione, ciò in assenza di patologie dell’apparato vocale che comportino un andamento innaturale e forzato dell’onda mucosa. A tal proposito, per maggiore chiarezza, potremmo identificare le due seguenti condizioni:

1) fissata l’intensità sonora – a parità di spinta del fiato – l’emissione vocale nel registro medio-grave comporta una contrazione delle corde vocali, con l’accostamento di una porzione minore di bordo cordale ma il coinvolgimento di uno spessore più consistente di massa cordale. Viceversa, nel registro acuto, si assiste ad un allungamento delle corde vocali, con accostamento di un tratto più lungo di bordo cordale e il coinvolgimento di uno spessore più contenuto di massa cordale.

2) fissata l’altezza del suono – a parità di tensione e lunghezza del tratto del bordo cordale accostato – l’aumento d’intensità sonora comporta l’accollamento di uno spessore maggiore di massa cordale e un più consistente, reciproco allontanamento delle rime della glottide.

L’esperienza (e il possibile riscontro fonometrico) ci insegna che, rispetto alle due condizioni prefigurate sopra, la migliore caratterizzazione timbrica della voce si ha quando il suono è grave e forte, ottenendo un colore chiaro, nitido, brillante, definito (… gli aggettivi potrebbero anche essere altri). Viceversa, il suono acuto e piano è caratterizzato da un minor numero e da una minore intensità dei parziali, ciò che conferisce al suono vocale fissità, opacità, “sfuocatura”, verosimilmente minore espressività. Non è un caso che il timbro della voce individuale possa mutare sensibilmente in età avanzata, fase nella quale si assiste ad un fisiologico rilassamento dei tessuti epiteliali, accompagnato dall’impossibilità di generare un tenore di reciproco accollamento tra le corde vocali paragonabile a quello della giovane età. Ripensando alla descrizione del meccanismo fonatorio fatta sopra, il rilassamento dei tessuti contribuisce infatti a rendere meno esplosivo lo sbuffo d’aria associato all’allontanamento delle rime della glottide, limitando così, particolarmente nel registro acuto, l’ampiezza dei parziali armonici.

Fig. 4) Emissione vocale cantata (F3 ≈ 174 Hz) nel piano e nel forte ottenuti con la sola variazione della pressione del fiato: a parità di frequenza appare evidente la generazione nel forte di una serie nutrita di parziali armonici nella regione prossima a 3000 Hz                                                                                                                                                (continua)