Viele Beiträge im Internet beschäftigen sich mit der Frage, wie man einen Sound von der DVD gut herunter bekommt, um ihn als WAV-Datei oder als MP3-File in einer anderen Anwendung zu nutzen. Wir aber, als Hobbyfilmer, wollten den Ton erst einmal auf die DVD drauf bekommen. Jetzt werden Sie fragen, wie man ein reines Soundprogramm mit zwei Schnittprogrammen vergleichen kann - doch warten Sie einfach mal ab. Sie haben nun also auf diesem Camcorder einen wunderschönen Film
aufgenommen. Dabei haben Sie Ihren Camcorder, wie im
Zu Hause schneiden Sie den Film (nachdem Sie ihn vom Camcorder auf Ihre Festplatte gebracht haben) und fügen Musikstücke aus unterschiedlichen CDs hinzu - so quasi als Hintergrundsound. Und dann rendern Sie das ganze Werk als AVI-File auf Festplatte, um den Film dann in einem zweiten Arbeitsschritt zu einem MPEG-File zu "encoden", um ihn dann via Authoringprogramm als DVD einer etwas "breiteren" Öffentlichkeit vorzustellen. Doch wenn Sie Ihren Film Opa, Oma und den Tanten präsentieren, fällt Ihnen evtl. auf, dass der Ton doch nicht ganz so rund klingt wie auf der Original-CD. Wo könnte die Ursache liegen? Auf diese Frage will ich versuchen im Laufe dieses EDV-TIPPs einzugehen.
Schauen wir erst mal, wo so eine Film-Hintergrundmusik herkommt. In den
meisten Fällen vermutlich von einer Audio-CD. Wie man an "Gema-freie" Musik
kommt, beantwortet Ihnen das Internet mit wenigen Mausklicks.
Wie man im nächsten Schritt durch "Grabben", d.h.
durch das Auslesen von Audiodaten von dem CD-ROM-Laufwerk an ein WAV-File
kommt, brauche ich ja vermutlich nicht mehr im Detail zu erklären. Meine
Lieblingsprogramme dazu sind
Schauen wir uns nun einmal einen typischen "Track" einer Audio-CD an,
so wird man sehen, dass das File
16 Bits pro Sample hat und eine Abtastrate von 44.100 Hz (nicht kHz) eingesetzt wurde. Lassen Sie sich nicht von dem Punkt zwischen der 44 und der 100 in der obigen Abbildung bzw. den kHz verblüffen. Die Amerikaner nutzen den Punkt in ihrer Software etwas anders als wir und so finden wir schon mal den ein oder anderen Übersetzungsfehler, wie hier im Audio-Editor 6.0.0.2 von Ulead. Im Abschnitt
Wir sprechen dabei von der sogenannten Abtast-Geschwindigkeit oder auch Sampling-Frequenz. Eine Sampling-Frequenz von 44.100 Hz (wie z.B. bei einer Audio-CD) bedeutet, dass das analoge Signal 44.100 Mal pro Sekunde abgetastet wird. Es werden also 44.100 Proben (englisch: samples) erfasst. Jedes Sample gibt über die zum Entnahmezeitpunkt anliegende Amplitude des Analogsignals Auskunft. Bei dieser Sampling-Frequenz wollen wir einen Augenblick verweilen: Sie gibt uns also letztlich an, wie fein bei der Analog/Digitalwandlung die zeitliche Auflösung der Signalstrukturen erfolgt und inwieweit hohe Frequenzen überhaupt übertragen werden können. Bei der für die CD üblichen Abtastfrequenz von 44,1 Kilohertz (kHz) beträgt die nutzbare obere Grenzfrequenz rund 22 kHz. Die Grundlage dafür haben der Binärcode-Vater Claude Elwood Shannon, sowie Harry Nyquist gelegt. Nach ihren Theorien kann ein analoges Signal exakt reproduziert werden, wenn die Abtastrate mindestens doppelt so hoch ist, wie die höchste Frequenz des analogen Signals. Im Umkehrschluss besagen die Theoreme, dass die obere Grenzfrequenz die Hälfte der Abtastrate ist. Somit kann eine Aufnahme mit 192 kHz Abtastrate alle Frequenzen bis 96kHz wiedergeben, während eine mit 44,1 kHz aufgenommene CD nur Frequenzen bis 22,05 kHz erlaubt.
Nun kann man lange darüber darüber spekulieren, ob Sie oder ich das auch alles hören. Bei einem jungen (!) und gesunden menschlichen Gehör z.B. liegt der wahrnehmbare Frequenzbereich zwischen 16 und 20 000 Hz. Im Alter nimmt nun vor allem der obere
Hörbereich des Menschen deutlich ab. Er sinkt bis auf 5.000 Hz herab. Sie
werden also nun fragen, was es soll, einen Ton von 22 kHz zu übertragen.
Aber kommen wir zurück auf die menschliche Hörfähigkeit: Reihenuntersuchungen mit zahlreichen Probanden haben gezeigt, dass der durchschnittliche Mensch reine Sinustöne anders wahrnimmt als Frequenzgemische. Während reine Sinustöne oberhalb 16-17 kHz meist nicht mehr wahrgenommen werden, "hört" man impulsartige Signale - z.B. den Klang einer Trommel - weit über 20 kHz hinaus. Nun werden Sie sagen, das ist doch ein sehr tiefes Geräusch. Ja aber - auch ein sehr impulsartiges. Dieses Erscheinungsbild lässt sich am besten mittels Fourier-Analyse erklären. Doch das ist eine Nummer zu groß, für das was wir hier machen wollen. Soviel nur zur Klarstellung: Ein Klang besteht nicht nur aus einer Frequenz. Zwar ist die tiefste im Klang vorhandene Frequenz die Grundschwingung, aber auf dieser Grundschwingung finden wir Oberwellen, die auch als "Harmonische" bezeichnet werden, wieder. Es sind die so genannten ganzzahligen Vielfachen der Grundschwingung. Je steiler nun der Anstieg eines Signals pro Zeiteinheit (z.B. Flanke eines Rechtecksignals), desto höhere Frequenzen sind im Signal enthalten. Ein Signal, wie z.B. ein Trommelwirbel oder ein Paukenschlag, hat recht starke Einschwingvorgänge, die neben den tiefen auch recht hohe Frequenzen erzeugen. Sind Frequenzanteile über 17 kHz oder sogar über 20 kHz vorhanden, ist die auditive Wahrnehmung - also die klangliche Unterscheidung - generell anders als bei einem Frequenzband, das bei 20 kHz oder gar schon bei 17 oder 18 kHz abgeschnitten wurde. Untersuchungen haben gezeigt, das wir solche hochfrequente Vorgänge bis über 40 kHz wahrnehmen. Eine Erhöhung der Abtastrate könnte sich hier positiv bemerkbar machen. Ich habe oben bewusst geschrieben, dass wir den Ton "wahrnehmen" - aber hören wir ihn wirklich, oder hören wir nur "Intermodulationsprodukte", die nichts oder nur sehr wenig mit dem eigentlichen Ton zu tun haben? Ich will das hier und heute nicht weiter untersuchen.
Qualitativ hochwertige Tonabnehmersysteme wie das Pickering XV15/400E haben einen Frequenzbereich weit über 20 kHz hinaus (hier z.B. 10 Hz - 25 kHz). Auch das Shure V15VxMR geht von 10 bis 25 kHz, während das Pickering XSP/3003 sogar einen Frequenzumfang von 10 Hz bis 30 kHz wiedergibt. Besonders bei Schallplatten war und ist also nach oben noch Spielraum vorhanden. Die dort recht leise übertragenen harmonischen Oberwellen sorgen dafür, dass das Signal nicht so "digital" und hart klingt, wie es besonders bei ersten CD-Playern der Fall war. Das heißt, Oberwellen sorgen wirklich dafür, dass Klänge harmonischer und wie man sagt "wärmer" klingen. Für mich persönlich haben nur rein analoge Systeme die hier beschriebene "Wärme des Klangs". Aber das ist eine ganz andere Baustelle, auf die ich hier nicht weiter eingehen will. Zu den Grenzen dieser Technik sehen Sie bitte eine Ausarbeitung über
Während eine Sampling-Frequenz von 44.100 Hz für die Herstellung einer VCD oder einer SVCD meist noch kein Problem war, ist eine solche Frequenz für eine DVD schlicht unzulässig! Bei einer DVD werden im Wesentlichen folgende Audioformate genutzt:
Tabelle 1 Wie Sie sehen, nutzt die DVD Sampling-Frequenz von > 48.000 Hz, um die wahrgenommene Dynamik eines Musikstückes zu erhöhen. Das bedeutet, wenn Sie eine DVD erzeugen wollen, müssen Sie an irgendeiner Stelle der Prozesskette die Sampling-Frequenz von 44.100 Hz, denn so kommt ja die Musik auf CD daher, auf 48.000 Hz wandeln, um normgerecht zu sein. Wir verbessern damit zwar nicht das Klangbild, weil das Ursprungssignal für eine CD erst mal nur mit 44,1 kHz gesampelt wurde, aber wir wollen es ja auch nicht verschlechtern. Und, wie gesagt, wir wollen uns mit 48 kHz der Norm der DVD bzw. unserem DV-Film anpassen.
Sie nehmen ein Schnittprogramm, wie z.B. den "Video Editor" aus dem Ulead MediaStudio 6.x und initialisieren ein neues Projekt:
Nun machen Sie den Videoschnitt und ordnen irgendwann Ihre ausgewählte Musik von CD hinzu: Am Ende "rendern" Sie Ihr Projekt wieder auf Festplatte:
und dabei wandeln Sie dann (vermutlich ohne, dass es Ihnen so richtig bewusst ist) die Sampling-Frequenz von 44.100 auf 48.000 Hz. Doch ist der Ton, der dabei entsteht auch so, wie Sie ihn gewohnt sind? Da mir mein Ton nicht immer so richtig gefiel, habe ich einmal versucht, die Ursache für die Missklänge zu finden.
Eingesetzt habe ich dabei eine Gleitton (getrennt für rechts und links) mit einem Frequenzgang zwischen 20 und 20.000 Hz, der mit einem 1-kHz Startton beginnt. Es handelt sich dabei um einen langsamen "Sweep" - also einen über den ganzen Frequenzbereich gleitenden Ton - mit Marken bei 100, 1.000 und 10.000 Hz. Auf dem nicht ausgesteuerten Kanal ist jeweils "Digital-Null" aufgezeichnet. Es gibt dabei also kein Übersprechen zwischen den Kanälen. Um den Hochtonfrequenzgang zu testen, habe ich weiterhin digital erzeugte Töne eingesetzt. Und zwar mit den Frequenzen 1, 18, 20 und 22 kHz. Um für meine späteren Testzuhörer zum Abschluss noch ein richtiges Musikereignis zu haben, wurde der 2. Satz von Robert Schumanns Symphonie Nr. 3 in Es-Dur op 97, "Rheinische Symphonie", gespielt von dem Los Angeles Phiharmonic Orchestra, sowie ein Ausschnitt aus dem 1. Akt von Giuseppe Verdis "Nabucco" mit Chor und Orchester der Deutschen Oper Berlin ausgewählt. Die entsprechenden Soundtracks habe ich mittels eines Plextors PX-W2410 CD-ROM-Laufwerkes und "Exact Audio Copy" als WAV auf Festplatte gebracht. Mit
Die Parameter wurden dabei nicht verändert, so dass die Sampling-Rate erhalten blieb. Dieses Soundfile habe ich mit einem speziellen "Scope-Programm" (hier: Spectrogram
Ver. 5.05) visualisiert (
Damit Sie auch etwas sehen können, hier einmal ein kleiner Ausschnitt vom linken Kanal:
Die "1" zeigt den Gleitton mit einem Frequenzgang zwischen 20 und 20.000 Hz. Die "2" zeigt die Töne mit den Frequenzen 18, 20 und 22 kHz. "3" zeigt den Anfang der Musikstücke. Soweit das Original. Schauen wir uns nun die WAV-Files an, die unsere Schnittprogramme "gerendert" haben. Fangen wir mal mit meinem Lieblingsprogramm,
dem "Video Editor" aus dem
Beide Tools nutzen offensichtlich das gleiche Wandlungsverfahren. Was habe ich also gemacht? Ich habe im ersten Schritt ein Musikstück ("gegrabbt" von CD) in das Schnittprogramm eingefügt und dann nur den Ton isoliert vom Bild nach draußen gerendert. Es entstand also nur ein WAV-File. Zum Vergleich habe ich ein kpl. AVI ausgegeben und den WAV-Anteil nachher wieder herausgetrennt. Wir kommen auf diesen Schritt in einer weiteren Folge noch zurück. Schauen wir uns nun ein solch gewandeltes File an: Und zwar nur die "1" von oben - also unseren Gleitton mit einem Frequenzgang zwischen 20 und 20.000 Hz. Auffällig ist dabei, der etwas eigenartige Frequenzanstieg.
Da steigt nicht nur eine Frequenz an, da steigen mehrere Frequenzverläufe an. Schauen wir uns zur Sicherheit das Original nochmals im Detail mit Hilfe einer Analyse des Frequenzspektrums an. Dazu bin ich auf dem Sweep bis etwa 20 kHz gefahren und habe mir die da sonst noch vorhandenen Frequenzen angesehen:
Neben einer deutlich sichtbaren Frequenz bei 20 kHz mit etwa -36 dB sieht man zwischen 14 und 16 kHz zwei Peaks, die aber kleiner -96 dB sind. Für die Ursachenforschung ist das erst mal zu vernachlässigen. Schaut man sich nun die Frequenzen in unserem etwas "kaputten" Video Editor- WAV aus dem Ulead MediaStudio 6.x an, so zeigt sich folgendes Bild:
Wir finden dort also jede Menge Frequenzen, die im Original überhaupt nicht vorhanden waren. Da konnte ich im Gleitton hoch oder runter fahren - überall ganz unbekannte Frequenzanteile, die da einfach nicht hingehörten und nur durch die Samling-Rate-Wandlung entstanden sind, denn sonst hat das Schnittprogramm ja nichts gemacht. Das war genau das "klirren", das ich bei einigen meiner AVIs als störend empfunden hatte. Nun gut, bei einem Musikstück der Pop-Musik mag das für das ungeschulte Gehör untergehen, für mich aber war das zu störend, dass ich nach anderen Wegen gesucht habe.
Wenden wir uns also im nächsten Schritt
Auch hier wieder das gleiche Spiel. Wieder "DV" und 48 kHz ausgewählt und den Sound als WAV von einer CD eingefügt - bzw. unseren Testsound mit 44,1 kHz
Auch hierbei wurde -wie schon bei MSP6.0- nur ein WAV-File
auf Festplatte "gerendert". Hier sieht das Ergebnis (mit unserem Scope-Programm
betrachtet) allerdings noch abenteuerlicher aus:
Auch hier schauen wir uns wieder die Frequenzen im Detail an:
Ich muss gestehen, ich habe zwar nicht das "absolute Gehör", aber das kann vermutlich auch der Laie bei einer einfachen Hörprobe heraushören, sofern sein Gehör nicht durch ständiges (lautes) MP3-hören geschädigt ist. ;-)
Dass man es besser machen kann, zeigt COOL Edit 2000 bei einer vergleichenden Wandlung der Sampling-Frequenz von 44.100 auf 48.000 Hz:
Das sieht im Prinzip aus wie das Original und auch der Vergleich der Scope-Bilder zeigt uns einen sauberen Anstieg der Frequenz:
Zum Abschluss des ersten Teils schauen wir uns noch den 22 kHz Ton (stellvertretend für die anderen digital erzeugten Töne) an. Das ist ein isolierter Ton, also nicht wie ein "Sweep" gleitend von einer Frequenz zur anderen, sondern mit einer festen Frequenz.
Das Bild, mit schwarzem Hintergrund, links zeigt das Oszillogramm (Amplitude über die Zeit) meines Test-Tons. Zuerst der Sweep und dann die vier Töne bei 1, 18, 20 und 22 kHz, gefolgt von den Musikstücken. Die 22 kHz habe ich mir bei meinen drei "Test-Teilnehmern" angesehen. Zur Vergrößerung klicken Sie bitte auf das Bild (bei den anderen Einzel-Frequenzen sieht es übrigens genau so aus). Oben im Bild, der mit Cool Edit gewandelte Sound zeigt sehr schön nur eine Spitze bei genau 22 kHz. Sowohl das Schnittprogramm "Video Editor" aus dem Ulead MediaStudio 6.x (Mitte / rechts) als auch Adobe Premiere 6.0 (Mitte / unten) sind mit den recht hohen Anforderungen des Testes nicht zurechtgekommen. Sie produzieren schlicht nur Müll! Wenn Sie eine DVD mit einem eigenen Sound herstellen wollen, dann müssen Sie die Sampling Frequenz von 48 kHz zu einem sehr frühen Zeitpunkt berücksichtigen. Verlassen Sie sich nicht auf die "Wandlungsfähigkeit" Ihres Schnittprogramms, denn wie der Test zeigt, sind die Klassiker - die meist "Allrounder" sind - mit qualitativ hochwertigen Sampling-Frequenz-Wandlungen überfordert. Vertrauen Sie da doch mehr den bzw. dem
Ergänzende oder weiterführende Links:
|
|
| ||