Auflösung

ist im Grundsatz erst einmal der kleinste unterscheidbare Unterschied zwischen zwei Zuständen, wie z.B. Tönen, Farben, Pegeln oder einfach nur physikalischen Größen.

In diesem EDV-TIPP geht es um die Auflösung beim (analogen) Fernsehen.

Erinnern wir uns an unser Wissen um den PC und um unsere Grafikkarte: Je größer die Auflösung, um so mehr Punkte bzw. Informationen können auf dem Bildschirm dargestellt werden und um so besser ist die Darstellung.

Da der Bildschirm in der Regel (bis auf wenige Ausnahmen in der Textverarbeitung) immer breiter als hoch ist, ergeben sich für die Angabe der Auflösung auch zwei verschiedene Werte.

Die Auflösung wird immer in darstellbaren Bildpunkten (Pixel) in der Breite mal darstellbaren Pixel in der Höhe angegeben. Gängige Beispiele sind 640 x 480, 800 x 600 oder 1024 x 768 Punkte.

Wir bewegen uns somit in einem Koordinatensystem:

koordinatenDer PC-Profi spricht z.B. von einer Auflösung von 800 x 600, wobei die 800 Bildpunkte auf der x-Achse (horizontal) liegen und die 600 Punkte auf der y-Achse (vertikal).

Betrachten wir also das uns allen bekannte analoge Fernsehbild:

Video (Bild) – Norm

Anders als beim Computer sprechen wir beim analogen Fernsehbild nicht von Bildpunkten, sondern von Zeilen und Linien.

Bei uns in Deutschland ist die PAL-Norm (PAL = Phase Alternation Line) gültig. Danach besteht ein analoges Fernsehbild aus zwei Halbbildern, die zusammen (elektronisch betrachtet) 625 Zeilen haben.

Um zu erklären, warum das Bild aus zwei Halbbildern aufgebaut ist, erlauben Sie mir folgenden Ausflug:

Das menschliche Auge verschmilzt einzelne Bilder zu einem kontinuierlichen Bewegungsablauf ab ca. 16 Bildern/Sekunde. Diese Bilder flimmern jedoch. Um dies zu vermeiden sind mehr Bilder notwendig.

Beim Kinofilm, der z.B. typisch mit 24 Bildern pro Sekunde arbeitet, wird ein Trick eingesetzt.

Dort gibt es eine rotierende Blende in jedem Projektor, welche den Lichtstrahl unterbricht, damit der Film um genau ein Bild vorgeschoben werden kann. Diese Blende soll bewirken, dass man den eigentlichen Transportvorgang des Films nicht sehen kann. Die Blende gibt also den Lichtstrahl erst dann wieder frei, wenn der Film zum nächsten Bild transportiert und angehalten worden ist.

Dadurch würde ein normaler Kinofilm mit 24 Bildern pro Sekunde ein stark flimmerndes Bild erzeugen (also bei 24 Hertz). Um dies zu vermeiden, schiebt sich die Flügel- oder auch Umlaufblende ein zweites mal in den Lichtstrahl, bevor das Bild weitertransportiert wird (Zweiflügel-Blende). Jedes Bild wird dann zweimal projiziert.

Dabei wird – bewerkstelligt durch diese Blende – jedes Bild zweimal auf die Leinwand geworfen. Also mit einer Bildfrequenz von 48 Hz.

Dieses Verfahren gibt es etwa seit 1924. Vorher arbeitete man mit 18 Bildern pro Sekunde, die 3 x gezeigt wurden.

Wer jetzt glaubt, sein teurer 100 Hz-Fernseher im heimischen Wohnzimmer könne das besser, täuscht sich, denn im Gegensatz zum Fernsehen, wo pro Sekunde 25 Halbbilder zeilenweise sukzessiv aufgebaut werden (und bei 100 Hz-TVs schlicht und ergreifend verdoppelt werden), werden im Kino 48 kpl. Einzelbilder mit bester Auflösung projiziert. Das Ergebnis ist jedem noch so guten Fernseher haushoch überlegen.

Beim Fernsehen haben wir also 25 Bilder in der Sekunde, was zum Verschmelzen der Bewegung ausreicht, nicht jedoch für die Flimmerfreiheit. Die Techniker haben beim Fernsehen ein Vollbild in zwei Halbbilder zerlegt, um beim Betrachter einen flimmerfreien Eindruck zu erwecken. Das sogenannte Zeilensprungverfahren (“Interlaced”-Darstellung) wurde erfunden (1927 von F.Schröter).

Danach besteht also, wie bereits gesagt, ein Fernsehbild aus zwei Halbbildern, die zusammen (elektronisch betrachtet) 625 Zeilen haben.

Jedes der 25 Vollbilder wird – wie im folgenden Bild veranschaulicht – in zwei Halbbilder zerlegt, wobei das erste Halbbild alle Zeilen mit ungeraden Zeilennummern besitzt und das zweite Halbbild alle geraden Zeilen.
animationBeide Halbbilder bestehen aus 312,5 Zeilen, da das erste Halbbild mit einer halben Zeile in der Bildmitte am unteren Rand endet und das zweite Halbbild mit einer halben Zeile am oberen Rand beginnt.

Diese Halbbilder werden mit der doppelten Frequenz (50Hz) hintereinander und dabei ineinander verschachtelt übertragen.

elchWer noch mehr zu dem Thema wissen möchte, kann mal bei http://www.lenz-online.de/interlace/ nachsehen.


Für alle, die immer schon mal wissen wollten, wie sich die Zeilenfrequenz in diesem Zusammenhang errechnet – hier die Einzelheiten:

  • Zeilenzahl (Zeilen pro Bild) = 625
  • Halbbildwechselfrequenz = 50 Hz (Bilder pro sec)
  • Vollbildwechselfrequenz = Halbbildwechselfrequenz / 2 = 25 Hz (Bilder pro sec)
  • Zeilenfrequenz = 625 (Zeilen/Bild) * 25 (Bilder/sec) = 15.625 (Zeilen/sec) = 15.625 Hz

Die nachstehende Abbildung soll (vereinfacht) die Lage der Zeilen im Koordinatensystem darstellen, damit wir uns auch darüber im Klaren sind, wann wir von Zeilen und wann von Linien sprechen.

zeilen
Die effektive Zeilenzahl je Bild ist jedoch geringer als die o.a. 625 Zeilen, da der Elektronenstrahl nicht sofort vom unteren Bildrand zum oberen Rand springen kann. Er benötigt dazu eine gewisse Zeitdauer.

Nach Norm steht dafür eine ‘Zeit von 25 Zeilen’ zur Verfügung. Von dem Rest liegen lediglich 575 im theoretisch darstellbaren Bereich und davon werden je nach Einstellung des Fernsehers auch nicht alle dargestellt.

Wir haben also auf der y-Achse (vertikal) 575 Zeilen.

Aus dieser Zeilenzahl ergibt sich die Auflösung, die man in vertikaler Richtung (z.B. durch eine Fernsehübertragung) erzielen kann.

Wenn man hier von Auflösung spricht, meint man eigentlich die “Strukturfeinheit”.

Stellen Sie sich vor, Sie wollen ein Bild mit 1150 horizontalen Linien (wie das o.a. Bild – also abwechselnd weiß und schwarz) übertragen, so müsste jede der 575 möglichen Fernsehzeilen eine horizontale weiße und eine schwarze Linie übertragen.

So ein Elektronenstrahl kann aber nicht gleichzeitig zwei verschiedene Zustände annehmen.

Er kann aber eine Zeile weiß (meist nur hell und nicht wirklich weiß) und die nächste Zeile schwarz (also dunkel) darstellen.

Man kann also in der Theorie 575 horizontale Zeilen oder rund 287 schwarz-/weiß-Wechsel in vertikaler Richtung unterscheiden. Das ist unsere vertikale Auflösung! (Das mit den “rund” 287 Wechseln hängt damit zusammen, dass der Elektronenstrahl in der Mitte des Bildes anfängt und nicht am linken Bildrand).

Da das nominelle Fernsehbildformat Breite zu Höhe = 4:3 ist, bedeutet das, dass in der horizontalen Richtung 575 x 4 / 3 ~ 767 senkrechte Linien übertragen werden müssten.

linienDiese “Linien” entsprechen also gedanklich den horizontalen Pixels, wie wir sie aus dem PC-Bereich kennen.

Nun sind diese 767 Linien 383 senkrechte schwarz/weiß-Wechsel.

Um eine horizontale Zeile zu schreiben, benötigt der Elektronenstrahl eine bestimmte Zeit. Ihm sind von der Norm dafür 64 µs vorgegeben. (Siehe oben: Zeilenfrequenz = 15.625 Hz oder 15.625 Zeilen/sec. Nach der Formel f = 1/t ergibt sich durch Umstellen die Zeit.

Also 1 / 15.625 Hz (Bilder pro sec) = 64 µs. Jetzt haben wir die Zeitdauer für eine Zeile.

Davon müssen wir allerdings noch die sogenannte Austastzeit von 12 µs abziehen. Übrig bleibt damit eine Zeit von 52 µs, also 52 * 10-6 s.

Schauen wir uns einmal so ein typisches Fernsehsignal an. (Die Fachleute unter Ihnen mögen mir die Vereinfachung verzeihen; ich habe zu Gunsten der Übersichtlichkeit auf die Darstellung der vorderen und der hinteren Schwarzschulter mit dem Burst und dem Farbsync. Signal verzichtet).

Ein Videosignal ist also vereinfacht eine Wechselspannung mit einer pulsierenden Gleichspannung überlagert. Bei + 0,7 Volt ist die Darstellung “weiß”, bei 0,35 V ist sie “grau” und bei Null Volt “schwarz”.

Zwischen 0 Volt und -0,3 Volt und um Null herum liegen die Zeilenaustastsignale und die sonst noch notwendigen “Burst”- und Sync.-Signale.

Nachstehend habe ich einmal ein Videosignal als Sinus aufgetragen, damit der Zusammenhang später zu der Darstellung einer Periode deutlicher wird.

bildinhaltDa ein Sinus aber recht schwer darzustellen ist, habe ich aus Gründen der vereinfachten Darstellung ein Rechtecksignal anstelle des Sinussignals genommen. Denn jetzt passiert genau das, was uns interessiert.

Wenn helle und dunkle Bildpunkte aufeinander folgen, tritt die maximale Bildfrequenz auf.

zeileSchauen wir uns eine Periode einer solchen Schwingung genauer an:

periode

Jedem weißen Bildpunkt ist eine positive und jedem schwarzen Bildpunkt eine negative Halbwelle des Bildsignals zugeordnet. Eine Schwingung führt also zu einem weißen und einem schwarzen Punkt – und damit zu zwei Bildpunkten.

In der obigen Abbildung habe ich nur eine Zeile dargestellt, stellen Sie sich aber bitte mal ein Blatt Papier vor. Auf das malen wir nebeneinander abwechselnd schwarze und weiße senkrechte Linien.

Nun erhöhen wir die Anzahl der Linien. Ab einer bestimmten Anzahl von Linien sehen Sie jetzt aber (aufgrund des Auflösungsvermögens des Auges) gar keine einzelnen Linien mehr, sondern nur noch eine graue Fläche. Genau diese Anzahl, ab der die Linien verschwimmen, ist die horizontale Auflösung.

Um die Frequenz zu ermitteln, teilen wir einfach die 767 Linien durch 2, da eine Schwingung aus 2 Bildpunkten bzw. Linien besteht und dann teilen wir das noch durch die uns zur Verfügung stehende Zeit von 52 µs. Das ergibt rund 7,4 MHz.

Mathematisch sieht das so aus:

  • Pixeldauer (Tp) = 52 µs / 767 Pixel = 67,7797 ns
  • Theoretische Bandbreite (Bth) = 1 / 2 * Tp = 7,375 MHz

Unsere 767 Linien würden also eine Bandbreite / Frequenz von ca. 7,4 MHz erfordern. Bildinformationen, aus denen eine höhere Frequenz resultiert, werden nicht mehr als hell/dunkel-Unterschied, sondern flächig dargestellt.

Erinnern Sie sich noch an die vertikale Auflösung?

575 horizontale Linien (Zeilen) oder rund 287 schwarz-/weiß-Wechsel hatten wir da. Untersuchungen haben gezeigt, dass diese theoretische vertikale Auflösung in der Praxis nicht erreichbar ist. (Stichwort: “Berücksichtigung eines endlichen Strahldurchmessers”).

Anstelle der 575 Zeilen sind in der vertikalen Richtung (y) nicht 575 Zeilen, sondern nur 575 x 0,65 = 373 Linien (Zeilen) sicher voneinander zu trennen. Wer sich für dieses Thema im Detail interessiert, kann im Internet ja mal nach dem Begriff “Kellfaktor” suchen.

Bedingt durch das Seitenverhältnis von 4 / 3 war es unnötig 767 Linien in x-Richtung zu übertragen.

Anstelle der 7,4 MHz waren eigentlich nur 7,4 MHz * 0,65 = 4,81 MHz erforderlich.
Nun muss man noch wissen, dass diese Festlegungen nach dem zweiten Weltkrieg in einer internationalen Kommission (CCIR) unter Vorsitz von Prof. Gerber (Schweiz) festgelegt wurden (Gerber-Norm). Die Deutschen hatten vermutlich -kriegsbedingt- zu diesem Zeitpunkt schlechte Karten und so einigte man sich in Europa auf etwas unterschiedliche Bandbreiten. Für Frankreich wurden 6 MHz, für England 5,5 MHz und für Deutschland 5 MHz festgelegt.

Rechnen wir von den 5 MHz auf die Anzahl der Linien bzw. Bildpunkte zurück.

  • Anzahl der Pixel = Bth * 2 * 52µs = 5 MHz * 2 * 52 µs = 520 Pixel

Wir haben also auf der horizontalen Ebene (x-Ebene) 520 senkrechte Linien, die sich pro Zeile in 260 Schwarzpunkte und 260 Hellpunkte aufteilen.

Praktisch sind es, bedingt durch die Farbsignalaufbereitung, den Betrachtungsabstand und Mehrwegeempfang deutlich weniger. Die in den Empfängern üblichen PAL – Demodulatoren begrenzen meines Wissens das Videosignal auf ca. 3,5 MHz.

  • = 3,5 MHz * 2 * 52 µs = 364 Pixel

Also haben wir nur noch 364 echte Linien mit 182 schwarz/weiß-Wechseln übrig. Für den Fernsehempfang werden an dieser Stelle häufig Auflösungen von 330 bis 360 Pixel oder Linien genannt.

Übrigens: Bei einem normalen VHS-Recorder z.B. steht Ihnen nur eine Bandbreite von 3 MHz zur Verfügung. Dieses Manko wurde durch die Einführung von S-VHS bzw. Hi8 aufgehoben. Die Aufzeichnungsqualität wurde stark verbessert und das Auflösungsvermögen wurde auf 5 MHz angehoben.

Das neue Medium DVD (Digital Versatile Disc) hingegen erreicht durch seine digitale Bildspeicherung eine Auflösung, die ungefähr 550 Linien entspricht.

Tatsächlich ist also mit dem Seitenverhältnis von 4:3 nicht die Auflösung gemeint, sondern nur das Seitenverhältnis zwischen Breite und Höhe. So kann ein Bild mit 625 Zeilen mit jeweils 200 „Bildpunkten“ auch ein Format von 4:3 ergeben. Man muss jeden einzelnen Bildpunkt nur 4 mal so breit (im Verhältnis zur Höhe) darstellen.

In der veröffentlichten Literatur findet man sehr häufig folgende Angaben:

Typ Linien-Anzahl
VHS 240
TV-Signal (Antenne) 330
S-VHS 400
Hi8 400
DV 500
DVD 550
Betacam 500-800

Die Angaben wurden aus Prospekten, Katalogen und Fachbüchern zusammengetragen.

Vergleiche auch:

Das bedeutet, dass VHS bei weitem die schlechteste Auflösung bietet. Sie können daran sehen, dass ein “Umkopieren” eines Videos von S-VHS oder Hi8 nach VHS erhebliche systembedingte Qualitätsverluste mit sich bringt.

Ziel sollte es sein, die Ausgangsebene nicht zu verlassen. Ein auf Hi8 aufgenommener Film sollte auf Hi8 oder S-VHS bleiben. Oder zumindest auf dem gleichen Niveau digitalisiert werden.


28. Mai 2014: Überarbeitet im Rahmen des Redesign dieser Webseite.

Diese Veröffentlichung ist auch Bestandteil des PDF-Dokumentes “Vom eigenen Videofilm zur fertigen Video-DVD