CI-Fotocommunity

Registriere Dich jetzt kostenlos!

Dadurch bekommst Du Zugang zu dem geschützten Mitgliederbereich, kannst beim Gebrauchtmarkt mitmachen und stellst nebenbei auch noch sicher, dass niemand Dir Deinen Wunsch-Usernamen wegschnappt.

Farbtiefe, Bittiefe, Dynamik ... und der ganze Rest

Du verlinkst auf Emil Martinec? Toll! Das tue ich auch immer wieder. Bloß verstanden wird das offenbar von vielen nicht.


Gruß, Matthias
 

Ich schlage vor, Du guckst Dir mal den von Robert (indirekt) verlinkten Aufsatz von Emil Martinec an, und dann überlegen wir gemeinsam, wessen Aussagen hier..
... schlicht falsch.
...und...
...sind.

Die Bit-Tiefe entscheidet ausschließlich darüber, wie präzise sich unterschiedliche Signalstärken in der Datei abbilden lassen. Das ist also nur von der Meßgenauigkeit des A/D-Wandlers abhängig. Man kann an ein und den selben Sensor einen schlechten A/D-Wander hängen, der vielleicht nur 200 unterschiedliche Werte messen kann, oder man nimmt einen, der 1.000.000 unterschiedliche Werte messen kann. Das ändert am Sensor und damit an der LW-Differenz zwischen den dunkelsten und hellsten Motivbereichen, die noch registriert werden können, nichts. Und wenn man den hochpräzisen A/D-Wander so einstellt, dass er nur Werte zwischen 0 und 1024 liefert, ändert das ebenfalls rein gar nichts an dem Sensor.

Hier wiederhole ich einfach nochmal meine Frage: Was ist Dynamik?

Natürlich liefert er nur 5LW, aber eben verteilt auf Werte zwischen 0 und 16.383. Und wenn Du das Bild dann in JPG umwandelst, hast Du Werte zwischen 0 und 255. Oder Du exportierst es als 16-Bit TIF und hast Werte zwischen 0 und 65.535.

Zeigst Du mir mal bitte mathematisch, wie Du den Wertebereich 0...255 oder 0...65535 linear und proportional (das hatte ich bislang unterschlagen, weil ich es für selbstverständlich halte, also 0 auf 0 und höchsten Wert auf höchsten Wert, dazwischen linear) auf 5LW verteilst?



Gruß, Matthias
 
Moin!

In diesem Thema kam die Diskussion um Farbtiefe, Bittiefe, Dynamik, Codierung in Raw- und Jpg-Dateien usw. auf, was dort offenbar störte. Hier wäre nun also der Platz, den "technischen" Teil der Diskussion unterzubringen.

Zur Einstimmung möchte ich nochmal auf einen Aufsatz von Emil Martinec namens "Noise, Dynamic Range und Bit Depth" verweisen, der eigentlich die meisten der aufgekommenen Fragen klären sollte.


Gruß, Matthias
 
Nochmal moin!


Bis der Rest der Diskussion hierher verschoben wird, fange ich schon mal an. Und zwar mit einem Gedankenexperiment, das ganz gut geeignet ist, zu erklären, was Rauschen denn überhaupt ist und wie es bei Bildsensoren zustandekommt.

Wir stellen uns verschieden große Tische vor (große und kleine Sensoren), die wir flächendeckend mit gleich hohen, aber unterschiedlich großen Gefäßen vollstellen (verschieden große Sensor-Pixel bzw. Sensel (für Sensor-Element)). Und diese Tische stellen wir für gleich lange Zeiten (die Belichtungszeit) in einen schön gleichmäßigen Regen. Die Regentropfen (Photonen/Elektronen) sollen alle gleich groß und schwer sein. Offensichtlich werden große Gefäße bei starker Beregnung (aufgrund längerer Beregnungszeit und/oder stärkerem Regen) mehr Tropfen enthalten, als kleine Gefäße be geringer Beregnung.

Aber vor allen Dingen werden nicht alle Gefäße von gleich viel Regentropfen getroffen, sondern ihre Anzahl ist statistisch verteilt. Mathematisch wird das durch die Poisson-Verteilung beschrieben, die bei ausreichender Tropfenzahl einer Gaußschen Normalverteilung entspricht mit -und jetzt kommt's- einer Standardabweichung, die gleich der Wurzel aus der mittleren Tropfenzahl ist. Wenn meine Gefäße im Mittel von 100 Tropfen getroffen wurden, dann ist die Standardabweichung σ= ±10, bei 1000 Tropfen ist sie ±32, bei 10000 Tropfen ±100. Und das bedeutet, dass bei einer mittleren Tropfenzahl von 100 ca. 70% der Gefäße zwischen 90 und 110 Tropfen enthalten werden, die anderen 30% enthalten noch mehr oder noch weniger. Die absolute Größe der Standardabweichung steigt also mit der Tropfenzahl. Aber viel wichtiger ist das Verhältnis aus mittlerer Tropfenzahl (Signal) und Standardabweichung (Rauschen), und dieses Verhältnis wird immer besser, je größer die Tropfenzahl ist. Bei im Mittel 100 Tropfen ist die Standardabweichung 10x kleiner, bei 1000 Tropfen 32x, bei 10000 Tropfen 100x. Und das ist der Signalrauschabstand, englisch abgekürzt SNR (Signal-to-Noise-Ratio) und meistens in dB angegeben. In meinen 3 Beispielen mit 100/1000/10000 Tropfen ist der SNR =20dB/30dB/40dB.

Das beschriebene ist nach meiner Einschätzung ein anschauliches Gedankenexperiment für Photonenrauschen (shot noise), und dieser Rauschanteil überwiegt bei heutigen Sensoren über einen weiten Belichtungs- und ISO-Bereich bei weitem alle anderen Rauschanteile. Es erklärt auch ganz anschaulich, warum kleine Sensel "auf Pixelebene" stärker rauschen und warum es bei geringer Belichtung stärker rauscht.

Bislang haben wir so getan, als könnten wir die Tropfenzahl exakt bestimmen. tatsächlich muss sie aber irgendwie gemessen werden. Das passiert in diesem Beispiel vielleicht mittels einer Skala an den Gefäßen, wo das Regenvolumen abgelesen werden kann. Angenommen, ich kann die Tropfenzahl auf diese Weise auf ±10 Tropfen bestimmen. Das entspricht bei einem Sensor dem Ausleserauschen. Das hat dann auf die im Mittel 10000±100 Tropfen keinen erkennbaren Einfluss, bei 100±10 aber doch. Die Statistik sagt nun, dass sich die Standardabweichungen in diesen Fällen quadratisch addieren, hier wird σ= ±√(10²+10²) = ±14.

Wie vergleiche ich nun Bilder von Sensoren mit unterschiedlicher Senselzahl? Nun, ich muss gleich viele Bildpunkte (und die nenne ich jetzt Pixel) erzeugen, und zwar sinnvollerweise 1. weniger als jeder der Sensoren Sensel haben 2. etwa soviele, wie ein Mensch beim betrachten eines Bilds überhaupt auflösen kann. Da kann man nun alle möglichen Annahmen treffen. Bill Claff nutzt etwa 1MPixel, DxOMark benutzt 8MPixel. Wenn ich nun also den Inhalt vieler kleiner Gefäße in wenige große zusammenschütte und für die dann die Standardabweichung bestimme, dann ist in denen natürlich die Tropfenzahl höher und dementsprechend der SNR größer, und zwar proportional zur Wurzel aus dem Pixelverhältnis bzw. um 10*LOG(Pvorher/Pnachher) dB. Das dürft Ihr gern mal bei DxOMark beim Vergleich der Ansichten "print" und "screen" verifizieren.

Man könnte in dieses Modell jetzt auch noch den ISO-Verstärker reinmodellieren, aber das spare ich mir erstmal. Entscheidend ist: Hohe ISO kommt mit geringerer Belichtung aus (das ist ja der Grund dafür), und allein deshalb rauscht es schon mehr. Bei einigen Kameras ändert sich das Ausleserauschen deutlich mit den ISO, bei anderen fast gar nicht, aber dazu später.

Und jetzt die Dynamik. Angenommen, mein Sensel kann insgesamt 50000 Elektronen aufnehmen ("Full Well Capacity") Dafür muss es von etwa doppelt sovielen Photonen getroffen worden sein ("Quanteneffizienz"), aber das spielt hier keine Rolle. 50000 ist eine durchaus realistische Zahl für heutige DSLR. Wenn der ganze Sensor nun so belichtet wird, dass alle Sensel im Mittel diese 50000 Elektronen enthalten (würden, geht ja nicht, 1/2 der Sensel würde überlaufen), dann ist σ= ±224 und der Rauschabstand wäre 47dB. Und angenommen, die Sensel hätten wirklich ein Ausleserauschen von ±10. Dann wäre der Rauschabstand bei 100 Elektronen 17dB und bei etwa 10,5 Elektronen 0dB. Dieser Punkt, wo SNR =0dB erreicht ist, ist bei DxOMark die Untergrenze des Dynamikumfangs. Die Obergrenze liegt 1/2LW unter der Senselkapazität, in meinem Beispiel wäre das 50000/√2 =35000. Und das Verhältnis dieser beiden Werte, ausgedrückt in Zweierpotenzen/Blenden/Lichtwerten ist der Dynamikumfang, hier also LOG2(35000/10,5) =12LW.

All das hatte bisher nichts mit der Bittiefe der Raw-Daten zu tun. Wenn wir mal eine lineare und elektronenzahlproportionale 14bit-Codierung annehmen (ich kenne keine Foto-Kamera, wo das nicht grundsätzlich so wäre), dann wäre die höchste codierbare Zahl 16383 und damit zu klein, um wirklich Elektronen einzeln zu "zählen" (die Höchstzahl soll ja 50000 sein). Mit einer Skalierung von etwas über 3 Elektronen pro "Zählschritt" könnte aber der gesamte Bereich abgedeckt werden. Ich nehme mal der Einfachheit halber den Faktor 4 an. Die Elektronenzahl wird dann in Vielfachen von 4 erfasst. Das ist bei großen Elektronenzahlen völlig egal, bei kleinen aber nicht. In der Nähe des SNR =0dB-Punktes werden also nicht 10, 11 oder 12,7 Elektronen gezählt (wegen des Ausleserauschens können auch Nachkommastellen vorkommen), sondern 8, 12 oder 16. Das bringt eine weitere Rauschquelle ins Spiel, das Quantisierungsrauschen. Und dessen Standardabweichung, die wiedr quadratisch zu den anderen zu addieren ist, ist Δ/√12, hier also 4/√12 = ±1,2. Angesichts eines angenommenen Ausleserauschens von ±10 spielt das überhaupt keine Rolle, die Dynamik sinkt dadurch nur minimal. Und selbst wenn man 12bit nutzen würde mit σq = ±4,7, hätte das fast keinen Effekt auf die Dynamik. Erst mit 10bit würde sie auf auf etwa 11LW sinken.

Natürlich hat die Quantisierung auch den Effekt, dass es leichter zu Tonwertabrissen kommen kann, was ich hier jetzt nicht berücksichtigt habe. Hier ging's ja erstmal nur um rauschen, Dynamik und Bittiefe.



Gruß, Matthias
 
Moin Matthias,

Danke für die ausführliche Erklärung, Dein anschauliches Beispiel macht das Verstehen einfacher. Das Thema Bittiefe habe ich noch nicht ganz durchblickt, da muss ich mich wohl noch das ein oder andere mal "durchkauen".

Auf jeden Fall ein sehr informativer und hilfreicher (ich kann nur ein Rating abgeben ;) ) Beitrag.


Gruß, Jan
 
Das Thema Bittiefe habe ich noch nicht ganz durchblickt, da muss ich mich wohl noch das ein oder andere mal "durchkauen".

Ja, das ist wenig anschaulich und ich habe auch lange dran gekaut. Es hilft aber, ganz streng statistisch zu denken: Wieviel breiter wird eine Gaußsche Glockenkurve, wenn ich keine "exakten" Werte nehme, sondern auf ganzzahlige Vielfache von 1, 2, 4 oder so gerundete? Auf dem Weg habe ich da "einen Griff dran" gekriegt.


Gruß, Matthias
 
Wenn wir mal eine lineare und elektronenzahlproportionale 14bit-Codierung annehmen (ich kenne keine Foto-Kamera, wo das nicht grundsätzlich so wäre),

Ist das wirklich so? In dem Fall nehme ich zurück, was ich gesagt hab, und wundere mich statt dessen nur über die Kamerahersteller. Eine nicht-lineare Kodierung wäre erheblich sinnvoller. Ich bin davon ausgegangen, dass die Entwicklung hier deutlich weiter ist. Naja, japanische Sensorhersteller sind halt keine schwäbischen Tüftler. Vielleicht sollte ich unsere Marketingabteilung mal drauf ansetzen ...

Grüße,

Heiner
 
Ja, meines Wissens ist das so. Canon addiert einen kleinen Offset, was angeblich beim Rausrechnen von Rauschen helfen soll. Wie das genutzt wird, konnte mir aber auch noch niemand erklären. Auf die Dynamik hat es aber keinen Einfluss.

Interessant finde ich den Gedanken, dass man in einer linearen 14bit-Datei, die künstlich mit Zahlen gefüllt wird und wo man deshalb kein Photonen- und kein Ausleserauschen hat, nur noch das Quantisierungsrauschen übrigbleibt und man dann mit 14bit 15,8LW Dynamik erreichen würde.


Gruß, Matthias
 
Vermutlich wäre es besser, gleich in EV zu rechnen. Das macht die Argumentationskette wahrscheinlich flüssiger. Und das Ganze muss linear sein. Den A/D-Wandler in der Prozesskette nicht vergessen. Der arbeitet rein linear.

LG Robert

Gesendet von meinem iPad mit Tapatalk HD
 
Zuletzt bearbeitet:
Vermutlich wäre es besser, gleich in EV zu rechnen. Das macht die Argumentationskette wahrscheinlich flüssiger.

Das tue ich doch: Zweierpotenz = Blendenstufe = Lichtwert (LW) = Exposure Value (EV). Ob das dadurch allerdings flüssiger wird? Man muss dafür schon "logarithmisch" denken können, sonst kommen ganz eigenartige Missverständnisse dabei raus.

Und das Ganze muss linear sein. Den A/D-Wandler in der Prozesskette nicht vergessen. Der arbeitet rein linear.

Klar, das ist ja der Grund, weshalb ich "lineare elektronenzahlproportionale 14bit-Codierung" annehme.


Gruß, Matthias
 
Und ich Dussel hab geglaubt, ich könne mit meiner Kamera einfach fotografieren. Aber wenn ich das hier so lese, war das große Latrinum doch was für'n...

Es zwingt Dich niemand, es zu lesen, wenn es Dich nicht interessiert. Also erspare uns bitte solche Kommentare, es gibt nämlich welche, die es eben doch interessiert.
 
dB = 10*log(x); EV = log2(x)

Einmal wird in dB gerechnet, einmal in EV. Vielleicht wird es flüssiger, wenn alle Größen in der gleichen Einheit dargestellt sind. Nur so 'ne Idee...

LG Robert




Gesendet von meinem iPad mit Tapatalk HD
 
Es zwingt Dich niemand, es zu lesen, wenn es Dich nicht interessiert. Also erspare uns bitte solche Kommentare, es gibt nämlich welche, die es eben doch interessiert.

Ein bisschen Humor tut manchmal gut!

Gruß
Jürgen
 
dB = 10*log(x); EV = log2(x)

Einmal wird in dB gerechnet, einmal in EV. Vielleicht wird es flüssiger, wenn alle Größen in der gleichen Einheit dargestellt sind. Nur so 'ne Idee...

DxOMark und viele andere stellen SNR in dB dar, Dynamik in EV, und daran halte ich mich aus Vergleichbarkeitsgründen.

Hier ist übrigens dB mit 20LOG(x) zu rechnen. Das ist mir als Akustiker, der ich bin, auch aufgestoßen. Obwohl Lichtmengen/Belichtungen usw. energie-"haftige" Größen sind (und mit 10 zu rechnen wären), werden sie als "Signal" (wie eine Spannung o.ä.) behandelt und mit 20 gerechnet.


Gruß, Matthias
 
Ein bisschen Humor tut manchmal gut!

Du meinst, ich kann dann auch einfach mal in eins Deiner Themen reingrätschen, was mich nicht interessiert, mich drüber lustigmachen und das ist dann "Humor"? Nein, tut mir leid, ich habe wenig Verständnis, dass Leute stolz darauf sind, etwas nicht zu verstehen und dafür dann auch noch Applaus ernten. Wenn das hier "die Norm" sein sollte, bin ich gleich wieder weg.
 
Nein, tut mir leid, ich habe wenig Verständnis, dass Leute stolz darauf sind, etwas nicht zu verstehen und dafür dann auch noch Applaus ernten.


Autsch!

Unser Echidna pflegt nunmal einen speziellen sarkastisch-ironischen Humor, den die meisten Teilnehmer hier durchaus zu schätzen wissen. Zu fehlendem Verständnis an der Materie wurde da nichts geschrieben...


Gruß, Jan
 
Unser Echidna pflegt nunmal einen speziellen sarkastisch-ironischen Humor, den die meisten Teilnehmer hier durchaus zu schätzen wissen. Zu fehlendem Verständnis an der Materie wurde da nichts geschrieben...

Och weeßte, Humor, den dann allerdings eher feinsinnig-hintenrum, habe ich genug. Aber dieses Reingrätschen mit der Bekundung von Desinteresse habe ich in fast jedem mathematisch-physikalischem Thema erlebt, aber noch nie woanders. Vielleicht sollte ich doch einfach mal....
 
Zurück
Oben