Rumore nella fotografia digitale


Ritengo utile (al mio ego e ad eventuali sparuti visitatori del mio blog) racchiudere e isolare il ragionamento sul rumore nella fotografia digitale che ho sviluppato autonomamente, sebbene non sia stato in questo originale, a partire da un concetto diffuso: quello dell'esposizione a destra. Le implicazioni teoriche dalle quali il ragionamento che è alla base della tecnica dell'esposizione a destra si diparte non mi hanno convinto da subito, le ritenevo banali. Attualmente il mio convincimento è proprio che, sebbene diffuse e comunemente accettate, siano errate o, come cercherò di chiarire in una appendice, sopravvalutate.

Quello che segue è sostanzialmente quanto già postato nel blog salvo alcune correzioni e adattamenti al contesto.

On-line il tema dell'esposizione a destra è variamente discusso ed affrontato (a questo proposito le fonti si sprecano, non le introdurrò perché è sufficiente usare google). Non mi addentrerò troppo nel descrivere cosa sia la tecnica dell'esposizione a destra, mi limiterò ad accennarne i contorni lasciando al lettore la possibilità di approfondire l'argomento.

Nella fotografia analogica su pellicola la cosa migliore da fare, solitamente, è centrare l'esposizione, per il digitale le cose vanno diversamente. Le diverse fonti on-line sono invariabilmente concordi nell'imputare il rumore fotografico presente nelle aree scure delle immagini al processo di digitalizzazione, in particolare alla discretizzazione dei livelli di luminosità introdotta dalla conversione Analogico Digitale. Sostanzialmente si imputa una maggiore "rumorosità" delle aree scure delle immagini alla scarsità di step di quantizzazione assegnati a quel livello di esposizione. Chiarisco: il processo di acquisizione di una immagine digitale parte dall'elemento fotosensibile unitario (photodetector) che, nella numerosità propria del sensore (se c'è coincidenza 1:1 fra photosite e photodetector), compone il sensore stesso. Tale dispositivo è, nella sostanza, un rivelatore di fotoni. I fotoni, limitati a certe lunghezze d'onda da una griglia RGB, colpiscono l'elemento fotosensibile in misura tanto maggiore quanto è maggiore l'esposizione dell'elemento stesso alla luce di un determinato colore. L'uscita di questo dispositivo è un segnale analogico "proporzionale" in prima approssimazione al numero di fotoni che l'hanno raggiunto. Un processo di campionamento e conversione Analogico/Digitale di tale segnale trasforma l'uscita analogica del singolo elemento del sensore in un valore digitale.

Supponiamo ora che il convertitore AD (chiamato anche semplicemente ADC ovvero Analogic Digital Converter)  sia un dispositivo a 12 bit, otterremo quindi 4096 step di quantizzazione: l'intervallo in ingresso all'ADC è scomposto cioè in 4096 "fette" alle quali è associato un valore numerico discreto. L'ingresso utile che non satura il convertitore sarà rappresentato cioè con 4096 livelli. Il progettista ovviamente adatta il circuito di campionamento e conversione AD alla finestra di valori utili in uscita dal sensore in modo che tutta la dinamica di quest'ultimo sia rappresentata.

Il limite inferiore di questa dinamica è rappresentato dal più basso livello di segnale distinguibile dal rumore sempre presente in un dispositivo reale. Il livello più basso non rappresenta quindi il valore 0 di esposizione bensì un valore tale da elevare l'uscita analogica dell'elemento fotosensibile sufficientemente al di sopra del rumore.

Il limite superiore della dinamica del segnale in uscita dall'elemento sensibile è invece dovuto alla saturazione dello stesso: immaginiamolo come un recipiente che si riempie a goccia a goccia (i fotoni) di cui leggiamo il livello.

Tenendo presente che crescendo (risp. calando) di uno step di esposizione la luce che colpisce il sensore raddoppia (risp. dimezza) e ipotizzando una linearità del photodetector (valida in prima approssimazione) abbiamo che: dei 4096 livelli ben 2048 sono assegnati alla lettura delle aree maggiormente esposte, 1024 a quelle che, rispetto alle prime, sono esposte un livello sotto e così via. Si giunge, per un sensore la cui dinamica sia ad esempio 6EV, ad assegnare solo 64* step di quantizzazione alle aree il cui livello di esposizione è il più basso registrabile.
* In realtà si ha che al valore di esposizione che corrisponde al range 6 step sotto quello più luminoso corrispondono livelli i da 32 a 64, 32 livelli e non 64. Quelli da 32 a 16 corrispondono al range 7 step sotto quello più luminoso e via proseguendo verso livelli di esposizione più bassa.

Imputando a questa scarsa rappresentatività la granulosità delle aree scure si giunge rapidamente a teorizzare la seguente buona pratica: se la dinamica della scena lo permette, ovvero se quella dinamica è significativamente inferiore alla dinamica registrabile dal sensore, posso sovraesporre l'immagine di 1 step o poco più in modo da portare le aree scure ad essere rappresentate con più livelli di quantizzazione. Con opportuni software si riporta poi l'esposizione al valore corretto. Il risultato è un effettivo, significativo e riscontrabile calo del livello di rumore nelle aree scure.

Ma la ragione è davvero questa? Tenterò di dimostrare che non è così.

Primo approssimativo ma significativo appunto alla questione così come è stata esposta: sovraespongo per rappresentare con più step le aree scure poi al computer riaggiusto l'equilibrio dello scatto riportando le aree scure in quel campo rappresentato da pochi livelli di quantizzazione, risultato è che le informazioni che avevo salvato sovraesponendo le perdo nuovamente. (vedi appendice)

A mio avviso la questione è legata al rumore.

Il rumore presente all'ingresso del convertitore è una somma di diverse componenti: una componente termica (crescente con la temperatura), una componente dovuta al processo stesso di lettura del valore, viste le dimensioni immagino presente una componente dovuta ad una reciproca influenza fra i segnali, ecc.ecc.

Il rumore è un segnale aleatorio, l'indicazione che se ne da è sempre in termini statistici. In una misura l'errore dovuto a rumore rappresenta una variazione sul valore della misura attesa. Ripetendo la stessa misura più volte è possibile stabilire che distribuzione statistica ha il disturbo, solitamente una gaussiana: i campioni saranno concentrati cioè attorno ad un valore centrale (che è il valore atteso nella misura). Uno dei parametri che definisce una distribuzione gaussiana è la deviazione standard che identifica la distanza quadratica media dei campioni dal valore atteso. 



dove xi è l'i-esimo campione e x segnato è il valore medio dei campioni. La deviazione standard si esprime nella stessa unità di misura della grandezza fisica oggetto di misurazione.

La deviazione standard è perciò un valore molto significativo per definire il livello di un rumore: ci indica un campo di variabilità attorno al valore atteso nel quale aspettarci la misura. Nel nostro caso la misura sarà quella dell'intensità della luce incidente l'elemento sensibile.

Che caratteristiche ha dunque il rumore che insiste sull'ingresso del nostro ADC?
Non trovo dati tecnici di sensori reali, sarebbero comunque di difficile interpretazione, sospetto anche (volutamente) difficilmente confrontabili e di scarso valore generale.

La foto che segue è presa dall'autorevole e conosciuto sito dpreview.com e può darci una idea approssimativa dei valori in gioco e dei principali contributi di rumore.

L'immagine è tratta da qui: http://www.dpreview.com/learn/?/key=dynamic+range
Le scale sono logaritmiche sia per le ascisse che per le ordinate. Quello 0 all'incrocio è un errore grossolano di chi ha realizzato il grafico (che è molto semplificato): per l'asse orizzontale quel punto vale 1, per l'asse verticale dovrebbe valere 0,1 che, nella rappresentazione di un valore discreto con 12 bit, non ha nessun senso.
Con questa rappresentazione gli step di valori di esposizione tagliano la retta obliqua in segmenti di lunghezza identica.
La questione da focalizzare in questa immagine è l'andamento della deviazione standard del rumore: cresce, si, ma molto debolmente, ha una pendenza molto minore rispetto alla rampa del segnale. Che comporta questo? La rampa e la curva del disturbo si allontanano sempre più. In scala logaritmica una piccola distanza implica una differenza enorme. Vediamo a spanne di che si tratta, prendiamo i tre punti sulla rampa del segnale che corrispondono approssimativamente ai seguenti:
P1=(10,100)
P2=(100,1000)
P3=(1000,10000)

A questi punti corrispondono determinati valori della deviazione standard, approssimando i valori ma non gli ordini di grandezza si estrapola:
D1=(10,3)
D2=(100,6)
D3=(1000,15)

Appare chiaro che sul punto P1 insiste un errore potenziale sulla misura percentualmente rilevante, sul punto P2 insiste un errore di quasi un ordine di grandezza inferiore, lo stesso si ripete sul punto 3. Le aree che presentano una maggiore esposizione sono cioè affette da un errore sulla misura dell'esposizione stessa decisamente inferiore rispetto alle aree più scure.

Che succede se applico a questo modello di rumore la tecnica dell'esposizione a destra?

Succede che "mappo" aree poco illuminate in una zona della dinamica del sistema che presenta un errore sulla misura basso.

Che cosa succede se in post elaborazione riporto l'equilibrio dell'immagine al valore reale, ovvero che succede quando riporto le aree scure al loro livello di esposizione?

Succede che l'errore percentuale sulla misura non varia (la misura è già stata fatta, qui applico una sorta di fattore di scala), ottengo perciò una misura del valore dell'intensità della luce incidente le aree più scure meno affetta da rumore. L'immagine apparirà perciò meno "quadrettata" nelle aree in ombra. L'effetto è tanto più evidente quanto più riesco a traslare l'istogramma verso il limite destro.

Qui termina il mio ragionamento sul motivo che presiede, nel campo digitale, alla best practice di esporre a destra.

Ora occorre dissipare il dubbio sull'incidenza dell'errore di quantizzazione (il processo che trasforma il segnale analogico continuo nel corrispondente segnale a "gradini" tipico della conversione AD) sul risultato finale ovvero sull'aspetto di una fotografia digitale.

Ho trovato questa fonte: http://tinyurl.com/3ehtuvt

Le pagine da 13 a 15 risolvono il dubbio: la quantizzazione non introduce un errore che sia significativo, e quindi rilevante, rispetto ai disturbi considerati sopra. Ovvero il confronto fra l'errore sul segnale in ingresso all'ADC e l'errore sul segnale in uscita dallo stesso mostra che questi non si distanziano l'uno dall'altro in maniera significativa. Risulta quindi non rilevante introdurre un contributo di errore dovuto alla conversione analogico/digitale.

Avrò scritto castronerie?
A molti forse interessa sapere come ottenere i migliori risultati e non perché li si ottengono operando in un certo modo. Ritengo questo, tuttavia, un modo superficiale di affrontare la questione.

Una corollario di questo ragionamento potrebbe spiegare, ad esempio, perché gli ADC sono a 12 bit invece che a 16 o 32: ridurre oltre un ragionevole livello di compromesso lo spessore dello step di quantizzazione è inutile perché i bit meno significativi sarebbero territorio esclusivo del rumore. Il progresso tecnologico sta portando alla realizzazione di sistemi nel complesso meno rumorosi e quindi alla possibilità di introdurre ADC a 14 bit e oltre.


Se desiderate commentare questo argomento fatelo sul blog. I contributi verranno valutati e, qualora lo ritenga necessario, questa pagina verrà modificata per comprenderli. Grazie.


Nessun commento: