Così come il nostro orecchio converte il suono in un impulso nervoso, così
il microfono è uno strumento trasduttore che converte il suono
in un segnale elettrico.
In realtà non è sempre stato così: il microfono del fonografo di Edison,
prima macchina funzionante per la registrazione (e la riproduzione) dei
suoni, trasduceva il suono in un segnale meccanico, segnale che era
costituto dal movimento oscillatorio di uno stili, collegato a una membrana,
che incideva un solco su un cilindro rivestito di cera.
In un microfono moderno, più precisamente, le variazioni di pressione
sonora sono convertite in variazioni di tensione elettrica.
Ricordiamo che la tensione elettrica (detta anche differenza
di potenziale) si misura in volt,
unità di misura il cui simbolo è V. Attenzione
che spesso (come in questa trattazione) si indica con lo stesso simbolo V
tanto la tensione elettrica quanto la sua unità di misura
fondamentale, il volt.
La pressione sonora, variando istante per istante, costituisce, come visto
al paragrafo precedente, il suono.
La tensione elettrica V generata dal microfono, pertanto
costituisce, istante per istante, un segnale elettrico che contiene le
informazioni relative alle variazioni di pressione sonora, e quindi alle
informazioni relative al suono.
Il microfono è pertanto uno strumento tipicamente analogico:
esso genera un segnale elettrico continuo, che può
assumere infiniti valori compresi tra un minimo e un massimo, che è in
analogia (ossia legato da una relazione, che può essere descritta da
una funzione matematica) con la pressione sonora.
Questa tensione è all'incirca proporzionale alla pressione sonora.
Il segnale elettrico, in genere piuttosto debole, può venire amplificato,
oppure può venire registrato per potere successivamente essere riascoltato,
eventualmente dopo averlo elaborato e/o modificato.
Sensibilità del microfono
Un parametro importante di un microfono è la sua sensibilità, che esprime
l'intensità del segnale elettrico generato (la tensione generata dal
microfono) rispetto alla pressione sonora che lo ha prodotto:
S = V / ps
dove:
S è la sensibilità del microfono
V è a tensione generata dal microfono, ossia il segnale elettrico
ps è la pressione sonora
Un microfono dalla sensibilità di 1 V/Pa genera quindi una tensione di 1 V
quando è sottoposta a una pressione sonora di 1 Pa.
La relazione vista mostra che c'è una proporzionalità diretta
tra la pressione sonora e la tensione generata dal microfono, e che la
sensibilità rappresenta il coefficiente di proporzionalità.
In genere i microfoni "reali" hanno una sensibilità di molto inferiore a
1 V/Pa , quindi si preferisce usare i sottomultipli del Volt, e quindi si
esprimerà la sensibilità mV/Pa.
un microfono Shure SM58, probabilmente il più diffuso microfono per
voce al mondo. Le sue specifiche tecniche danno una sensibilità di 1,6
mV/Pa
Poiché una pressione sonora di 1 Pa corrisponde a un livello sonoro di 94 dB
(vedi paragrafo precedente), la sensibilità del microfono rappresenta,
numericamente, la tensione generata dal microfono quando questo è sottoposto
a una pressione sonora di 94 dB.
Spesso la sensibilità di un microfono è espressa convenzionalmente in dBV in
riferimento a una pressione sonora di 1 Pa, secondo la relazione;
SdBV = 20·log(S)
dove:
S è la sensibilità espressa in V/Pa
Il microfono illustrato prima (il Shure SM58), che ha una sensibilità S =
1,6 mV/Pa, ossia di 0,0016 V/Pa, avrà pertanto una corrispondente
sensibilità
SdBV = 20·log(0,0016) = - 65 dBV
Poiché nei microfoni "reali" la sensibilità S è in genere (di molto)
inferiore a 1 V/Pa, ne consegue che la SdBV è in genere un valore
negativo.
Confrontando un
microfono A con sensibilità -20dBV e un microfono B con sensibilità
-26dBV, il microfono A risulterà il doppio più sensibile di B (in
quanto c'è una differenza di 6 dBV)
Esistono diversi tipi di microfono, a seconda della tecnologia
costruttiva che impiegano. Citiamo, perché i più importanti:
microfoni dinamici: non molto sensibili, ma più robusti. Non hanno
bisogno di essere alimentati da una tensione esterna o da una batteria
interna;
microfoni a condensatore: molto sensibili, ma anche più delicati.
Hanno bisogno di essere alimentati da una tensione esterna (detta
tensione "phantom" che viene fornita attraverso il cavo di
collegamento dall'apparecchiatura - amplificatore o registratore o mixer
- cui sono collegati), o da una batteria interna (e quindi possono
essere collegati anche a un apparecchio che non fornisce la tensione
phantom)
Direzionalità di un microfono
La sensibilità del microfono non è, in generale, uguale in tutte le
direzioni. Spesso è maggiore in una direzione frontale che nelle altre.
La differente sensibilità del microfono nelle varie direzioni è
rappresentata dal diagramma polare, che mostra
appunto la sensibilità nelle varie direzioni.
Spesso nei diagrammi polari è utilizzata la sensibilità SdBv
Il diagramma polare di un microfono. Si vede che frontalmente (0°) la
sensibilità è maggiore che nella direzione laterale a 90°, (dove è circa
- 6 dBV). Nella direzione opposta la sensibilità è bassissima, per cui
un microfono con un diagramma polare di questo tipo, non capta, o quasi,
i suoni provenienti da dietro.
Abbiamo diversi microfoni classificati per direzionalità
(indifferentemente dal fatto che siano dinamici o a condensatore):
microfoni omidirezionali: hanno sensibilità pressoché uguale in tutte
le direzioni. Sono utili per catturare suoni ambientali;
microfoni a cardioide o direzionali: più sensibili frontalmente che
lateralmente e assai meno posteriormente. Devono il loro nome alla forma
del diagramma polare, a "cardioide", che ricorda un cuore. Sono utili
per captare suoni "davanti", senza essere disturbati dai suoni che
vengono "da dietro" Il Shure 58 è un tipico microfono cardioide;
microfoni superdirezionali: hanno sensibilità elevata e "concentrata"
in direzione frontale. Sono utili quando si ha necessità di captare
suoni in una precisa direzione. Per ragioni costruttive in genere
captano anche suoni anche nelle direzioni a 90° e a 180°;
Risposta in frequenza di un microfono
Se un suono è costituito di diverse frequenze (come in genere è qualsiasi
suono "reale"), e viene riprodotto amplificando o attenuando le varie
frequenze in modo diverso, risulterà modificato. L'espressione che si usa
è che il suono risulta distorto. Un buon microfono a parità di
pressione sonora dovrebbe dare un segnale elettrico quanto più uguale
possibile uguale indifferentemente dalla frequenza del suono. Tuttavia un
certo grado di distorsione può essere del tutto accettabile.
Quando viene indicata, ad esempio una risposta in frequenza di un
microfono 50÷20˙000 Hz, si intende dire che quel microfono dà un segnale
elettrico costante, a parità di pressione sonora, per tutte le frequenze
tra i 50 e i 20˙000 Hz. Sarebbe più corretto dire che ha una risposta in
frequenza lineare tra i 50 e i 20˙000 Hz.
Poiché l'orecchio è sensibile dai 16 ai 16˙000 Hz (circa), quel microfono
darà una distorsione solo sotto i 50 Hz, cioè per suoni di frequenza molto
bassa (magari non sarà l'ideale per registrare un contrabbasso o un
fagotto, ma andrà certo bene per registrare il parlato).
La risposta in frequenza di due diversi microfoni a confronto. Si vede
come quello sopra (un Oktawa 319) abbia una risposta in frequenza più
"piatta", e quindi darà meno distorsione alle basse e alte frequenze.
Quello sotto ha una sensibilità attenuata alle basse frequenze, ma
anziché un difetto può essere visto come un "filtro" per escludere
rumori e disturbi, anche se produce una certa distorsione.
Amplificazione del suono
Il segnale elettrico proveniente dal microfono è in genere assai debole,
e per poterlo tradurre in un segnale che un altoparlante (o speaker) sia
in grado di riprodurre come un suono deve essere opportunamente
amplificato.
L'amplificatore è un apparecchio che ha proprio la funzione di
amplificare il segnale elettrico un maniera quanto più fedele al segnale
originale.
Il concetto di risposta in frequenza visto prima vale anche per gli
amplificatori (e anche per le altre apparecchiature utilizzate per
trattare e modificare il suono). Un amplificatore con una risposta in
frequenza lineare, ad esempio, compresa tra 20 e 20˙000 Hz, è in grado di
riprodurre, senza distorcerle, le frequenza comprese in quella gamma.
Il segnale elettrico amplificato può venire inviato a un altoparlante.
Esso metterà in vibrazione una membrana che riprodurrà il suono, che sarà
il suono, opportunamente amplificato, che è stato captato dal microfono.
Emissione del suono
I suoni amplificati, o registrati e poi riprodotti, devono essere emessi
dai diffusori acustici (o altoparlanti, o speaker, o "casse") per essere
ascoltati.
Il suono emesso è prodotto da una membrana che viene fatta vibrare dal
segnale elettrico inviato dall'amplificatore.
La membrana, vibrando, mette a sua volta in vibrazione l'aria producendo
così il suono.
La struttura che contiene la membrana (una "cassa" in legno, o antri
materiali, o un elemento a forma di "tromba") facendo vibrare l'aria al
suo interno, contribuisce notevolmente all'amplificazione del suono.
Un altoparlante si caratterizza per la potenza elettrica (espressa in W)
che è in grado di trasformare in energia sonora e per la sua risposta in
frequenza.
Altoparlanti di piccole dimensioni (tweeter)
risultano migliori per la diffusione delle alte frequenze, quelli di
grandi dimensioni (woofer) per la diffusione
delle basse frequenze.
Spesso gli altoparlanti contengono due o tre membrane di differenti
dimensioni: un dispositivo (il cross-over)
suddivide il segnale elettrico nelle diverse frequenze inviando le basse
frequenze alla membrana più grande, e le alte frequenze alla membrana più
piccola, allo scopo di migliorare la qualità di emissione.
Anche una "cuffia" (in inglese headphone) si
basa sullo stesso principio, e contiene due altoparlanti di piccole
dimensioni da porre sulle orecchie dell'ascoltatore. Vista la vicinanza ai
timpani dell'ascoltatore la potenza richiesta è ovviamente molto bassa.
Registrazione analogica del suono
I suoni possono essere registrati analogicamente. Si tratterà di registrare,
per poi riprodurre, le variazioni temporali del segnale elettrico prodotto
dal microfono.
In genere il segnale elettrico proveniente da un registratore richiede un
primo stadio di amplificazione per potere essere registrato.
Sono stati utilizzati diversi sistemi (e alcuni vengono ancora utilizzati)
per registrare analogicamente i suoni.
La registrazione fonografica su disco, che trae
origine dalla registrazione su cilindro inventata da Edison nel 1877 con il
suo fonografo, consiste nel riprodurre le variazioni del segnale elettrico
captato dal microfono mediante un solco tracciato sulla superficie che si
allarga e si restringe proporzionalmente all'intensità del segnale.
L'incisione di un disco-matrice avviene mediante uno stilo che oscilla
proporzionalmente al segnale elettrico che gli viene inviato. Il disco
matrice viene utilizzato per produrre uno stampo, da cui vengono stampati i
dischi (attualmente in vinile) che verranno posti in commercio. L'ascolto
del disco avverrà facendo passare nei solchi uno stilo (la "puntina") che,
vibrando a causa della forma dei solchi che si allargano e si restringono,
produrrà, mediante una cartuccia, simile nel principio di funzionamento a un
microfono, un segnale elettrico che verrà amplificato.
I solchi ingranditi di un disco in vinile.
La registrazione magnetica su nastro
(inizialmente avveniva su filo magnetico) consiste nel magnetizzare con un
campo magnetico un nastro (in genere di poliestere) ricoperto da un ossido
magnetico proporzionalmente al segnale elettrico, facendolo passare davanti
a una testina di registrazione (che è l'elemento dove viene
generato il campo magnetico). Nella riproduzione del segnale registrato il
nastro, passando davanti a una testina di riproduzione, produce un debole
segnale elettrico proporzionale al campo magnetico registrato, e quindi, a
sua volta, al campo elettrico che ha prodotto il campo magnetico. Tale
segnale elettrico potrà essere amplificato e il suono registrato potrà
essere riascoltato.
Un'interessante metodo di registrazione, ormai in disuso, è laregistrazione
ottica utilizzata nel cinema: la colonna sonora è
costituita da una striscia trasparente su fondo nero (o viceversa) lungo la
pellicola che si allarga e si restringe proporzionalmente al segnale
elettrico registrato. La riproduzione avviene mediante una fotocellula, il
cui segnale elettrico verrà opportunamente amplificato. La colonna sonora ottica su questa pellicola cinematografica è visibile
tra fotogramma e perforazione sul lato sinistro.
La stereofonia
Noi sentiamo con due orecchie. Il suono, a seconda del punto da cui è
emesso, arriva alle nostre due orecchie con intensità diversa: un suono ad
esempio proveniente da destra verrà percepito con maggior intensità
dall'orecchio destro, e la più importante decodifica che il nostro cervello
compie è proprio questa.
Ma un suono proveniente da destra arriverà anche con tempi diversi alle
nostre due orecchie, si parla di millisecondi, ma questo fa sì che il
cervello decodifichi la posizione da cui esso proviene anche grazie a questo
fatto.
Inoltre l'angolazione differente da cui proviene il suono rispetto ai
padiglioni auricolari fa sì che avvenga una filtratura differente: alcune
frequenze risulteranno più o meno attenuate in modo differente dai due
padiglioni auricolari. Anche questo crea una decodifica differenziata da
parte del cervello che riecce così a individuare la diversa provenienza dei
suoni. Ascoltando un'orchestra sinfonica, ma anche ascoltando le voci che
provengono da un ambiente riusciamo a capire da che parte arrivano.
La registrazione stereofonica (stereo = solido, in greco) avviene
posizionando due microfoni in due punti diversi e con due angolazioni
diverse rispetto alla sorgente sonora. Riascoltando la registrazione da due
sorgenti (due auricolari, o due altoparlanti) si avrà la sensazione della
ricostruzione tridimensionale delle sorgenti sonore.
Registrazione stereofonica nella metropolitana di Milano, 12-05-2019:
ascoltarla in cuffia e individuare (se si riesce) la direzione di
provenienza dei suoni.
Registrazione digitale del suono
È attualmente il metodo di registrazione più utilizzato, e quello che
approfondiremo maggiormente.
Per potere registrare digitalmente un segnale elettrico, proporzionale al
segnale sonoro, sarà necessario campionarlo digitalmente.
Questo significa misurare la sua intensità con una certa frequenza temporale
(cioè un certo numero di volte nell'unità di tempo), rappresentando queste
misure con dei valori numerici, per poterla registrare (come sequenza di
numeri) o per poterla elaborare.
Il campionamento avviene in un dispositivo che è il convertitore
analogico/digitale.
L'input è il segnale elettrico analogico (una tensione variabile nel tempo),
l'output è una "stringa" di numeri, in forma binaria
Schema di conversione del segnale da analogico a digitale. La linea
rossa rappresenta il segnale analogico. I segmenti verticali neri
rappresentano i campionamenti. Il convertitore converte l'ampiezza dei
segmenti in numeri, che rappresentano la loro misura. Il segnale digitale
è costituito da stringhe di bit che rappresentano i valori dei
campionamenti.
È evidente che la misura sarà tanto più accurata quanto maggiore sarà la
frequenza di campionamento, e quanto più ampia sarà la scala di
rappresentazione di queste misure.
Esiste certo un parallelo logico tra la frequenza di campionamento e
risoluzione di un immagine digitale.
Esiste anche un parallelo logico tra l'ampiezza della scala di
rappresentazione della misura campionata e la profondità di colore in un
immagine.
Per quest'ultima, l'ampiezza della scala di rappresentazione della misura
del segnale elettrico, si parla di profondità del campionamento.
Il teorema del campionamento afferma che per ricostruire una frequenza f è
necessario campionarla con una frequenza di campionamento fc
almeno doppia.
Pertanto se si vogliono campionare fedelmente tutti i suoni udibili
dall'orecchio umano, poiché la frequenza massima è 16˙000 Hz, sarà
necessario campionarli con una fc di almeno 32˙000 Hz (o 32 kHz).
La frequenza di campionamento dei CD audio è un po' superiore, pari a 44,1
kHz. In studio di registrazione sono normali frequenze di campionamento di
96 kHz (o anche maggiori).
La profondità di campionamento si esprime in bit: ad esempio una profondità
di campionamento di 16 bit (lo standard per i CD audio) permette di
distinguere 216 = 65˙536 differenti valori di intensità del
segnale.
Ogni secondo di suono stereofonico registrato alla qualità del CD utilizza
44˙100 Hz · 16bit · 2canali =1˙411˙200 bit/s = 176˙400 Byte/s = 176,4 kB/s.
Esempio di suono stereofonico campionato (rappresenta dal secondo
44,7035 al secondo 44,7095 della registrazione "nella metropolitana di
Milano, 12-05-2019" proposta poco prima)
L'esempio sopra mostra 3/1000 di secondo (0,0030 s) di registrazione. I
puntini visibili rappresentano i singoli campionamenti. I valori numerici di
ogni campionamento sono dati dalla distanza rispetto alla linea dello zero.
Poiché il suono è campionato con una frequenza di campionamento di 48˙000
Hz 1/1000 (si veda in alto a sinistra dove si legge Stereo, 48000Hz) di
secondo avrà 48 campionamenti.
E poiché il suono è campionato con una profondità di 16 bit (si veda in
alto a sinistra dove si legge 16-bit PCM) la distanza dalla linea del -1.0
alla linea del 1.0 va intesa suddivisa in 216 = 65˙536
differenti possibili valori