<< paragrafo precedente << || torna all'indice || >> paragrafo successivo >>

La registrazione del suono

Il microfono

Così come il nostro orecchio converte il suono in un impulso nervoso, così il microfono è uno strumento trasduttore che converte il suono in un segnale elettrico.

In realtà non è sempre stato così: il microfono del fonografo di Edison, prima macchina funzionante per la registrazione (e la riproduzione) dei suoni, trasduceva il suono in un segnale meccanico, segnale che era costituto dal movimento oscillatorio di uno stili, collegato a una membrana, che incideva un solco su un cilindro rivestito di cera.

Edison phonograph-CnAM 18732-IMG 5311

In un microfono moderno, più precisamente,  le variazioni di pressione sonora sono convertite in variazioni di tensione elettrica. Ricordiamo che la tensione elettrica (detta anche differenza di potenziale) si misura in volt, unità di misura il cui simbolo è V. Attenzione che spesso (come in questa trattazione) si indica con lo stesso simbolo V tanto la tensione elettrica quanto la sua unità di misura fondamentale, il volt.




La pressione sonora, variando istante per istante, costituisce, come visto al paragrafo precedente, il suono.

La tensione elettrica V generata dal microfono, pertanto costituisce, istante per istante, un segnale elettrico che contiene le informazioni relative alle variazioni di pressione sonora, e quindi alle informazioni relative al suono.

Il microfono è pertanto uno strumento tipicamente analogico: esso genera un segnale elettrico continuo, che può assumere infiniti valori compresi tra un minimo e un massimo, che è in analogia (ossia legato da una relazione, che può essere descritta da una funzione matematica) con la pressione sonora.

Questa tensione è all'incirca proporzionale alla pressione sonora.

Il segnale elettrico, in genere piuttosto debole, può venire amplificato, oppure può venire registrato per potere successivamente essere riascoltato, eventualmente dopo averlo elaborato e/o modificato.

Sensibilità del microfono

Un parametro importante di un microfono è la sua sensibilità, che esprime l'intensità del segnale elettrico generato (la tensione generata dal microfono) rispetto alla pressione sonora che lo ha prodotto:

S = V / ps

dove:


Un microfono dalla sensibilità di 1 V/Pa genera quindi una tensione di 1 V quando è sottoposta a una pressione sonora di 1 Pa.

La relazione vista mostra che c'è una proporzionalità diretta tra la pressione sonora e la tensione generata dal microfono, e che la sensibilità rappresenta il coefficiente di proporzionalità.

In genere i microfoni "reali" hanno una sensibilità di molto inferiore a 1 V/Pa , quindi si preferisce usare i sottomultipli del Volt, e quindi si esprimerà la sensibilità mV/Pa.

Shure SM58-1708032215

un microfono Shure SM58, probabilmente il più diffuso microfono per voce al mondo. Le sue specifiche tecniche danno una sensibilità di 1,6 mV/Pa


Poiché una pressione sonora di 1 Pa corrisponde a un livello sonoro di 94 dB (vedi paragrafo precedente), la sensibilità del microfono rappresenta, numericamente, la tensione generata dal microfono quando questo è sottoposto a una pressione sonora di 94 dB.

Spesso la sensibilità di un microfono è espressa convenzionalmente in dBV in riferimento a una pressione sonora di 1 Pa, secondo la relazione;


SdBV = 20·log(S)

dove:

Il microfono illustrato prima (il Shure SM58), che ha una sensibilità S = 1,6 mV/Pa, ossia di 0,0016 V/Pa, avrà pertanto una corrispondente sensibilità

SdBV = 20·log(0,0016) = - 65 dBV

Poiché nei microfoni "reali" la sensibilità S è in genere (di molto) inferiore a 1 V/Pa, ne consegue che la SdBV è in genere un valore negativo.

Confrontando un microfono A con sensibilità -20dBV e un microfono B con sensibilità -26dBV, il microfono A risulterà il doppio più sensibile di B (in quanto c'è una differenza di 6 dBV)

Esistono diversi tipi di microfono, a seconda della tecnologia costruttiva che impiegano. Citiamo, perché i più importanti:

Direzionalità di un microfono

La sensibilità del microfono non è, in generale, uguale in tutte le direzioni. Spesso è maggiore in una direzione frontale che nelle altre.

La differente sensibilità del microfono nelle varie direzioni è rappresentata dal diagramma polare, che mostra appunto la sensibilità nelle varie direzioni.
Spesso nei diagrammi polari è utilizzata la sensibilità SdBv

Polar pattern cardioid

Il diagramma polare di un microfono. Si vede che frontalmente (0°) la sensibilità è maggiore che nella direzione laterale a 90°, (dove è circa - 6 dBV). Nella direzione opposta la sensibilità è bassissima, per cui un microfono con un diagramma polare di questo tipo, non capta, o quasi, i suoni provenienti da dietro.


Abbiamo diversi microfoni classificati per direzionalità (indifferentemente dal fatto che siano dinamici o a condensatore):

Risposta in frequenza di un microfono

Se un suono è costituito di diverse frequenze (come in genere è qualsiasi suono "reale"), e viene riprodotto amplificando o attenuando le varie frequenze in modo diverso, risulterà modificato. L'espressione che si usa è che il suono risulta distorto. Un buon microfono a parità di pressione sonora dovrebbe dare un segnale elettrico quanto più uguale possibile uguale indifferentemente dalla frequenza del suono. Tuttavia un certo grado di distorsione può essere del tutto accettabile.

Quando viene indicata, ad esempio una risposta in frequenza di un microfono 50÷20˙000 Hz, si intende dire che quel microfono dà un segnale elettrico costante, a parità di pressione sonora, per tutte le frequenze tra i 50 e i 20˙000 Hz. Sarebbe più corretto dire che ha una risposta in frequenza lineare tra i 50 e i 20˙000 Hz.

Poiché l'orecchio è sensibile dai 16 ai 16˙000 Hz (circa), quel microfono darà una distorsione solo sotto i 50 Hz, cioè per suoni di frequenza molto bassa (magari non sarà l'ideale per registrare un contrabbasso o un fagotto, ma andrà certo bene per registrare il parlato).



La risposta in frequenza di due diversi microfoni a confronto. Si vede come quello sopra (un Oktawa 319) abbia una risposta in frequenza più "piatta", e quindi darà meno distorsione alle basse e alte frequenze. Quello sotto ha una sensibilità attenuata alle basse frequenze, ma anziché un difetto può essere visto come un "filtro" per escludere rumori e disturbi, anche se produce una certa distorsione.

Amplificazione del suono

Il segnale elettrico proveniente dal microfono è in genere assai debole, e per poterlo tradurre in un segnale che un altoparlante (o speaker) sia in grado di riprodurre come un suono deve essere opportunamente amplificato.

L'amplificatore è un apparecchio che ha proprio la funzione di amplificare il segnale elettrico un maniera quanto più fedele al segnale originale.

Il concetto di risposta in frequenza visto prima vale anche per gli amplificatori (e anche per le altre apparecchiature utilizzate per trattare e modificare il suono). Un amplificatore con una risposta in frequenza lineare, ad esempio, compresa tra 20 e 20˙000 Hz, è in grado di riprodurre, senza distorcerle, le frequenza comprese in quella gamma.

Il segnale elettrico amplificato può venire inviato a un altoparlante. Esso metterà in vibrazione una membrana che riprodurrà il suono, che sarà il suono, opportunamente amplificato, che è stato captato dal microfono.

Emissione del suono

I suoni amplificati, o registrati e poi riprodotti, devono essere emessi dai diffusori acustici (o altoparlanti, o speaker, o "casse") per essere ascoltati.

Il suono emesso è prodotto da una membrana che viene fatta vibrare dal segnale elettrico inviato dall'amplificatore.

La membrana, vibrando, mette a sua volta in vibrazione l'aria producendo così il suono.

La struttura che contiene la membrana (una "cassa" in legno, o antri materiali, o un elemento a forma di "tromba") facendo vibrare l'aria al suo interno, contribuisce notevolmente all'amplificazione del suono.

Un altoparlante si caratterizza per la potenza elettrica (espressa in W) che è in grado di trasformare in energia sonora e per la sua risposta in frequenza.

Altoparlanti di piccole dimensioni (tweeter) risultano migliori per la diffusione delle alte frequenze, quelli di grandi dimensioni (woofer) per la diffusione delle basse frequenze.

Spesso gli altoparlanti contengono due o tre membrane di differenti dimensioni: un dispositivo (il cross-over) suddivide il segnale elettrico nelle diverse frequenze inviando le basse frequenze alla membrana più grande, e le alte frequenze alla membrana più piccola, allo scopo di migliorare la qualità di emissione.

Anche una "cuffia" (in inglese headphone) si basa sullo stesso principio, e contiene due altoparlanti di piccole dimensioni da porre sulle orecchie dell'ascoltatore. Vista la vicinanza ai timpani dell'ascoltatore la potenza richiesta è ovviamente molto bassa.

Registrazione analogica del suono

I suoni possono essere registrati analogicamente. Si tratterà di registrare, per poi riprodurre, le variazioni temporali del segnale elettrico prodotto dal microfono.

In genere il segnale elettrico proveniente da un registratore richiede un primo stadio di amplificazione per potere essere registrato.

Sono stati utilizzati diversi sistemi (e alcuni vengono ancora utilizzati) per registrare analogicamente i suoni.

La registrazione fonografica su disco, che trae origine dalla registrazione su cilindro inventata da Edison nel 1877 con il suo fonografo, consiste nel riprodurre le variazioni del segnale elettrico captato dal microfono mediante un solco tracciato sulla superficie che si allarga e si restringe proporzionalmente all'intensità del segnale. L'incisione di un disco-matrice avviene mediante uno stilo che oscilla proporzionalmente al segnale elettrico che gli viene inviato. Il disco matrice viene utilizzato per produrre uno stampo, da cui vengono stampati i dischi (attualmente in vinile) che verranno posti in commercio. L'ascolto del disco avverrà facendo passare nei solchi uno stilo (la "puntina") che, vibrando a causa della forma dei solchi che si allargano e si restringono, produrrà, mediante una cartuccia, simile nel principio di funzionamento a un microfono, un segnale elettrico che verrà amplificato.

Vinyl groove macro
I solchi ingranditi di un disco in vinile.

La registrazione magnetica su nastro (inizialmente avveniva su filo magnetico) consiste nel magnetizzare con un campo magnetico un nastro (in genere di poliestere) ricoperto da un ossido magnetico proporzionalmente al segnale elettrico, facendolo passare davanti a una testina di registrazione (che è l'elemento dove viene generato il campo magnetico). Nella riproduzione del segnale registrato il nastro, passando davanti a una testina di riproduzione, produce un debole segnale elettrico proporzionale al campo magnetico registrato, e quindi, a sua volta, al campo elettrico che ha prodotto il campo magnetico. Tale segnale elettrico potrà essere amplificato e il suono registrato potrà essere riascoltato.

Un'interessante metodo di registrazione, ormai in disuso, è la registrazione ottica utilizzata nel cinema: la colonna sonora è costituita da una striscia trasparente su fondo nero (o viceversa) lungo la pellicola che si allarga e si restringe proporzionalmente al segnale elettrico registrato. La riproduzione avviene mediante una fotocellula, il cui segnale elettrico verrà opportunamente amplificato.

La colonna sonora ottica su questa pellicola cinematografica è visibile tra fotogramma e perforazione sul lato sinistro.

La stereofonia

Noi sentiamo con due orecchie. Il suono, a seconda del punto da cui è emesso, arriva alle nostre due orecchie con intensità diversa: un suono ad esempio proveniente da destra verrà percepito con maggior intensità dall'orecchio destro, e la più importante decodifica che il nostro cervello compie è proprio questa.

Ma un suono proveniente da destra arriverà anche con tempi diversi alle nostre due orecchie, si parla di millisecondi, ma questo fa sì che il cervello decodifichi la posizione da cui esso proviene anche grazie a questo fatto.

Inoltre l'angolazione differente da cui proviene il suono rispetto ai padiglioni auricolari fa sì che avvenga una filtratura differente: alcune frequenze risulteranno più o meno attenuate in modo differente dai due padiglioni auricolari. Anche questo crea una decodifica differenziata da parte del cervello che riecce così a individuare la diversa provenienza dei suoni. Ascoltando un'orchestra sinfonica, ma anche ascoltando le voci che provengono da un ambiente riusciamo a capire da che parte arrivano.

La registrazione stereofonica (stereo = solido, in greco) avviene posizionando due microfoni in due punti diversi e con due angolazioni diverse rispetto alla sorgente sonora. Riascoltando la registrazione da due sorgenti (due auricolari, o due altoparlanti) si avrà la sensazione della ricostruzione tridimensionale delle sorgenti sonore.


Registrazione stereofonica nella metropolitana di Milano, 12-05-2019: ascoltarla in cuffia e individuare (se si riesce) la direzione di provenienza dei suoni.

Registrazione digitale del suono

È attualmente il metodo di registrazione più utilizzato, e quello che approfondiremo maggiormente.

Per potere registrare digitalmente un segnale elettrico, proporzionale al segnale sonoro, sarà necessario campionarlo digitalmente.

Questo significa misurare la sua intensità con una certa frequenza temporale (cioè un certo numero di volte nell'unità di tempo), rappresentando queste misure con dei valori numerici, per poterla registrare (come sequenza di numeri) o per poterla elaborare.

Il campionamento avviene in un dispositivo che è il convertitore analogico/digitale.

L'input è il segnale elettrico analogico (una tensione variabile nel tempo), l'output è una "stringa" di numeri, in forma binaria




Schema di conversione del segnale da analogico a digitale. La linea rossa rappresenta il segnale analogico. I segmenti verticali neri rappresentano i campionamenti. Il convertitore converte l'ampiezza dei segmenti in numeri, che rappresentano la loro misura. Il segnale digitale è costituito da stringhe di bit che rappresentano i valori dei campionamenti.

È evidente che la misura sarà tanto più accurata quanto maggiore sarà la frequenza di campionamento, e quanto più ampia sarà la scala di rappresentazione di queste misure.

Esiste certo un parallelo logico tra la frequenza di campionamento e risoluzione di un immagine digitale.

Esiste anche un parallelo logico tra l'ampiezza della scala di rappresentazione della misura campionata e la profondità di colore in un immagine.

Per quest'ultima, l'ampiezza della scala di rappresentazione della misura del segnale elettrico, si parla di profondità del campionamento.

Il teorema del campionamento afferma che per ricostruire una frequenza f è necessario campionarla con una frequenza di campionamento fc almeno doppia.

Pertanto se si vogliono campionare fedelmente tutti i suoni udibili dall'orecchio umano, poiché la frequenza massima è 16˙000 Hz, sarà necessario campionarli con una fc di almeno 32˙000 Hz (o 32 kHz).

La frequenza di campionamento dei CD audio è un po' superiore, pari a 44,1 kHz. In studio di registrazione sono normali frequenze di campionamento di 96 kHz (o anche maggiori).

La profondità di campionamento si esprime in bit: ad esempio una profondità di campionamento di 16 bit (lo standard per i CD audio) permette di distinguere 216 = 65˙536 differenti valori di intensità del segnale.

Ogni secondo di suono stereofonico registrato alla qualità del CD utilizza 44˙100 Hz · 16bit · 2canali =1˙411˙200 bit/s = 176˙400 Byte/s = 176,4 kB/s.


Esempio di suono stereofonico campionato (rappresenta dal secondo 44,7035 al secondo 44,7095 della registrazione "nella metropolitana di Milano, 12-05-2019" proposta poco prima)

L'esempio sopra mostra 3/1000 di secondo (0,0030 s) di registrazione. I puntini visibili rappresentano i singoli campionamenti. I valori numerici di ogni campionamento sono dati dalla distanza rispetto alla linea dello zero.

Poiché il suono è campionato con una frequenza di campionamento di 48˙000 Hz 1/1000 (si veda in alto a sinistra dove si legge Stereo, 48000Hz) di secondo avrà 48 campionamenti.

E poiché il suono è campionato con una profondità di 16 bit (si veda in alto a sinistra dove si legge 16-bit PCM) la distanza dalla linea del -1.0 alla linea del 1.0 va intesa suddivisa in 216 = 65˙536 differenti possibili valori




da aggiungere: i filtri e l'equalizzazione

<< paragrafo precedente <<>> paragrafo successivo >>



Livio Colombo
Alcuni diritti riservati:
Licenza Creative Commons
Quest'opera è distribuita con Licenza Creative Commons Attribuzione - Non commerciale - Non opere derivate 3.0 Italia.