Grundlagen Digitaltechnik Teil 2

Grundlagen

Digitaltechnik im Klartext, Teil 2

Nachdem ich im vorangegangen Teil die Entwicklung und Besonderheiten, jedoch auch gewisse Problematiken der diversen Wandlertechnologien sowie solche digitaler Aufzeichnungen und der verwendeten Systeme eine Betrachtung fanden, wenden wir uns diesmal künftigen Aspekten zu.

Ausblicke

Ein gutes digitales Aufnahme- als auch Wiedergabesystem des 21. Jahrhundert sollte sich durch Akkuratesse und Neutralität in der Aufzeichnung des Audiosignals auszeichnen und dabei alleine dem verantwortlichen Aufnahmeteam die klangliche Ausgestaltung der Aufnahme überlassen. Am Ende stellt es ein großes Glück für den Konsumenten dar, daß Sony bei der CD-Entwicklung anders als damals Philips (14-Bit-System) auf der 16-Bit-Wortbreite bestanden hat. Die Qualität von 16-Bit/44,1kHz-PCM für ein Distributionsmedium bereits final bearbeiteter Tonaufnahmen ist letztendlich so hoch, daß wohl 99 Prozent der Verbraucher kein wirkliches Bedürfnis nach einem neuen Format verspüren – worauf auch der Marktanteil von DVD-Audio und SACD letztendlich schließen lassen. Die aktuellen und hochwertigen professionellen digitalen Aufnahmesysteme können mittlerweile kaum noch von Konzertsälen, Mikrophonen sowie analoger Elektronik mit Signalen versorgt werden, die eine Herausforderung an ihr erreichbares S/N-Verhältnis darstellen würden. Tonmeister benötigen eine komfortable Aussteuerungsreserve für Produktionszwecke, wobei am Ende 24 bis heute sogar 28 Bit Wortbreite dort mehr als genug erscheinen, um hervorragende Aufnahmen zu fertigen. Bei professionell ausgeführter Wortlängenreduktion eines 24-Bit-Datenwortes unter Verwendung von Dither und Noise Shaping auf die 16 Bit Zielwortlänge einer CD, lassen sich selbst niederpegelige Signalanteile erhalten, deren Pegel deutlich unterhalb des LSB (Least Significant Bit) eines 16-Bit-Systems liegen. Die Erfinder der guten alten CD hatten dieser bereits mit der Emphasis-Funktion sogar eine Möglichkeit mitgegeben, die heute in Verbindung mit dem Einsatz von In-Band-Noise-Shapern ein Großteil des Rauschens in den Frequenzbereich oberhalb 15 kHz verlagern könnten und so bei der CD unterhalb 10 kHz sogar einen Störabstand von 120 dB ermöglichen – der damit äußerst nahe an der SACD-Spezifikation liegen würde. Dazu wird vor der Quantisierung auf 16 Bit der Hochtonbereich mittels eines einfachen 6-dB-Shelving-Filters angehoben und bei der Reproduktion diese Anhebung durch eine komplementäre De-Emphasis wieder rückgängig gemacht. Am Ende würde dabei wieder ein linealglatter Frequenzgang herauskommen. Das Quantisierungsrauschen würde mit diesem „Trick“ durch die Deemphasis ebenfalls mit herabgesetzt werden. Eine mit Preemphasis aufgenommene CD rauscht oberhalb 1 kHz deutlich wahrnehmbar weniger und bei 20 kHz wäre dieser Vorteil bis auf 10 dB angewachsen. Zudem ist die Nutzung der Preemphasis/Deemphasis-Funktion bereits seit Anbeginn in den allermeisten CD-Player eingebaut. Trotz dieser bedeutsamen praktischen Vorteile wird Preemphasis/Deemphasis heutzutage kaum mehr angewandt, was vielleicht ein weiteres Indiz darstellt, daß der Dynamikumfang der CD weder von der Phono-Industrie noch vom Verbraucher als ein nennenswertes Problem angesehen wird. Es bleibt zudem zu konstatieren, daß der gesamte Produktionsprozeß einer SACD in den meisten Fällen vorher in Multi-Bit-PCM stattgefunden hat oder zwecks Nachbearbeitung auf digitaler Ebene zunächst in PCM umgewandelt wurde. Alles war vorher also schon einmal in PCM da. Dabei erinnern wir uns an den Zusammenhang, daß eine aufwendige digitale Signalbearbeitung kaum innerhalb der DSD-Domäne vorgenommen werden kann. Sofern also die Qualität der jeweilig zum Einsatz kommenden D/A-Wandler dieses zuläßt, wird der Hörer bei der SACD eher auf dem CD-Layer einer Hybrid-SACD dem Klang des Stereo-Masterbandes unmittelbar am nächsten kommen. Vielen Verbrauchern droht es besonders heute, den geschickten Werbestrategen auf den Leim zu gehen. Diese versuchen, durch Konditionierung auf pseudo-signifikante Leistungszahlen „erfolgreich“ vermittelt, daß es ohne „3,2 GHz“ und „24/96“ nicht mehr geht. Die Macht der großen und kleinen Zahlen als vermeintliche Garanten für High-End-Sound. Gerade die so beworbenen hochintegrierten „Gerätschaften“ sind dieses oftmals jedoch gerade am allerwenigsten. Dafür sorgen nicht selten miserable analoge Ausgangsstufen, Low-Budget-Wandler, „Klingeldraht“-Verbindungen und unterdimensionierte, schlecht entstörte Netzteile. Erst allmählich sickert scheinbar das Wissen ins Bewußtsein zurück, daß nichts die klangliche Güte einer Aufnahme oder Wiedergabe so sehr bestimmt wie zum einen die Klangerzeugung (Instrument/Stimme), Raum, Mikrophonierung, Vorverstärkung, gegebenenfalls eine maßvolle (!) Dynamikbearbeitung, Aufnahme-Pegel und A/D-Wandlung als zum anderen, auf Seiten der Hörer, die spezielle Qualität der jeweils zum Einsatz kommenden Quellen- und Endgeräte: D/A-Wandler, Vorverstärker, Endstufen und Lautsprecher.

Seit mehreren Jahren befindet sich der Verbraucher wahrhaft in einer Dauer-Olympiade der Spezifikationswettkämpfe wieder. Das derzeit allgegenwärtige Schneller-Höher-Weiter hat nur noch bedingt mit den eigentlichen audiophilen Interessen zu tun. Die Qualität der internen Filter-, Oversampling- und Dithering-Strategie eines A/D-Wandlers hat spätestens ab 20 Bit/ 44,1 kHz wesentlich mehr Einfluß auf dessen klangliche Güte als die nominale Auflösung der Formel „Amplitude/Zeit/Dynamikumfang“. Allerdings ist die Entwicklung und der Bau eines wirklichen Top-End-A/D-Wandlersystems mit 24 Bit und 44,1kHz Abtastrate mit einem nicht zu unterschätzenden fachlichen Know-How verbunden, welches auch entsprechende Kosten nach sich ziehen muß. An dieser Stelle möchte ich einem weit verbreiteten Irrtum vorbeugen, daß über die einfache Benennung der Wortbreite oder einer exorbitant hohen Samplingfrequenz wirklich aussagekräftige Rückschlüsse auf die tatsächliche akustische „Auflösungsfähigkeit“ eines digitalen Systems gemacht werden können. Experten wie Robert Stuart und Richard Elen machen deutlich, daß die Wortbreite lediglich den Dynamikumfang (Rauschspannungsabstand) und Quantisierungsgenauigkeit (versus Interpolationsfehler) definiert, während die akustische Auflösung eines Systems von der Qualität des Ditherings bestimmt wird. Eine hohe Impuls-, Frequenz- und Phasentreue, sehr geringe Jitterwerte mit günstiger spektraler Verteilung und ein hoher Störspannungsabstand sind die wichtigen Eigenschaften, die einen wirklich klangneutralen A/D- und D/A-Wandler beschreiben können; aber der „Teufel“ steckt dabei oft im Details.

In den vergangenen zehn Jahren haben auf professioneller Ebene verschiedene, sehr aufwendig gestaltete, klangvergleichende Untersuchungen in Richtung Analog-Digital und PCM-Audio versus DSD-Audio stattgefunden. Die Ergebnisse daraus erwiesen, daß unter Einsatz technisch korrekt und sauber arbeitender A/D-D/A-Wandlertechnik, die penibel auf Klangneutralität und Akkuratesse ausgelegt wurde, bei spätestens 24 Bit und 48 kHz PCM-Audio zwischen analogem Originalsignal und dem durch eine A/D-D/A-Strecke gelaufenen selbigem analogen Ausgangsignal von den Probanden kein Unterschied mehr gehört werden konnte – wobei der Autor dieser Zeilen bei Top-End-Wandlersystemen bereits bei einer Samplingfrequenz von 44,1 kHz absolut keinen klanglichen Unterschied mehr feststellen kann. Von daher bleibt es mehr als fraglich, ob der Trend zu immer höheren Abtastraten und die damit beabsichtigte Erhöhung der möglichen oberen Grenzfrequenz bei PCM-Audio als auch der DSD-Audiotechnik wirklich sinnvoll bzw. technisch tatsächlich effizient und nützlich ist!? Der Einsatz von Sampling-Frequenzen bei PCM-Audio weit oberhalb 44,1 oder 48 kHz erscheint schon aus der aufnahmetechnischen Praxis heraus betrachtet als wenig sinnvoll, da nur sehr wenige Mikrophone bei der Tonaufnahme überhaupt Signale bis 20 kHz übertragen! Im gesamten audiotechnischen Bereich gibt es keine wirklichen klangrelevanten musikalischen Informationen im Frequenzbereich 20 kHz. Der eigentliche Grundtonbereich der Musik liegt weit darunter und ausgehend von diesen Grundtönen fallen die dabei entstehenden Obertöne dazu exponentiell ab. Tonmeister, die mit Mikrophonen bei der Tonaufzeichnung arbeiten, benötigen Aufgrund des „begrenzten“ Frequenzbereiches der aufzuzeichnenden Instrumente keine höhere Grenzfrequenz als 20 kHz. Der aufmerksame Leser wird jetzt einzuwenden haben, daß die Überlegung der Verwendung einer höheren Samplingfrequenz als 44,1 oder 48 kHz bei der Aufnahme auf eine Erhöhung der Anzahl und damit der „scheinbaren“ Genauigkeit der Abtastproben des analogen Signalverlaufs zielt. Bei genauer Eruierung der tatsächlichen Sachverhalte könnte sich dieser Gedankengang aber als Irrglaube herausstellen. Die grundlegende Regel, auf der die korrekte Funktion der kompletten digitalen Audiotechnik basiert, sagt: Frequenzen, die kleiner sind als die halbe Abtastfrequenz, können vollends und ohne jegliche Abstriche mit beliebiger Präzision und Phasengenauigkeit rekonstruiert werden. Zwar quantisiert Digitaltechnik – aber nicht wie vielfach angenommen die Zeit, sondern die analoge Signalamplitude! Bei 44,1 kHz wird bekanntlich alle 22 Mikrosekunden ein Abtastwert quantisiert. Da aber die analoge Amplitude mit einer konstanten Abtastrate abtastet wird, können trotzdem auf Nanosekunden genau zwei Signale zueinander versetzt aufgezeichnet werden, die auch aus dem digitalen System mit dem gleichen Zeitversatz von wenigen Nanosekunden wieder herauskommen. Messungen an einem wohl derzeit neutralsten Top-End-Wandlersystem der Welt aus deutscher Entwicklung und Fertigung ergaben, daß bei einer Samplingfrequenz von 44,1 kHz ein Phasenfehler von 0,07 Grad auftrat – bei einer Frequenz von 20 kHz – was auf die Zeit zurückgerechnet eine Genauigkeit im zeitlichen Verlauf von 10 Nanosekunden bedeutet. Das dazu verwendete Audiomeßsystem arbeitete hierbei mit einer Abtastfrequenz von „nur“ 48 kHz! Vor diesem Hintergrund wird auch nochmals besonders deutlich, daß sehr niedrige Jitterwerte mit spektral günstiger Verteilung für die Realisierung eines „State of the Art“-Wandlersystem von eminent wichtiger Bedeutung sind. Hohe Jitterwerte und/oder ungünstige spektrale Verteilung verschlechtern sowohl den theoretisch möglichen Rauschabstand als auch die räumliche Ortung einer Aufnahme. Jitterbehaftete Frequenzen in den Seitenbändern können insbesondere bei durch Masterclock gesteuerten Systemen der Wandlung hörbare nichtlineare Verzerrungsprodukte erzeugen. Diese treten nur bei vorhandenem Audiosignal auf, steigen mit höheren Audiopegeln an und sinken bei kleineren Audiopegeln wieder ab. Ein „schlechtes“ technisches Schaltungsdesign um die eigentliche Wandlertechnik herum kann trotz Verwendung eines oder mehrerer hochwertiger und moderner 24-Bit-Wandlerbausteine zu einer „Einengung“ der real verfügbaren Dynamik auf die eines 18-Bit-Systems führen. Die restlichen 6 Bit würden dabei im erzeugten Eigenrauschpegel der jeweiligen Schaltungsauslegungen ungenutzt verloren gehen. Man sollte zur besseren Verdeutlichung der absoluten Größenverhältnisse einmal einen sehr hochwertigen PCM-Audio-A/D-Wandler wie ein Meßgerät betrachten – dabei würde eine 10-Bit-Signalauflösung eine erzielbare Genauigkeit von 0,1 %, eine 12-Bit-Signalauflösung bereits eine erzielbare Genauigkeit von 0,025% und eine 16-Bit-Signalauflösung eine erzielbare Genauigkeit von 0,001563% ermöglichen! Ein korrekt arbeitendes Wandlersystem mit einer Signalauflösung von tatsächlichen 16 Bit bei 44.100 Hz Samplingfrequenz stellt bereits für ein Musiksignal eine wirklich sehr genaue Auflösung (Quantisierung) dar – die eigentlich selbst für höchste Ansprüche ausreichend ist, sofern dem nicht „30 Rechenoperation“ am Signal innerhalb der 16 Bit Wortlänge auf digitaler Ebene folgen, da etwaige darauf folgende Rundungsfehler dann durchaus hörbar das Signal beeinflussen könnten. Aus diesem Grunde wird heute mit einer Datentiefe von 24 bis sogar 28 Bit aufgezeichnet und Berechnungen zur weiteren Optimierung der Rundungsfehler auf einer 32 bis 40 Bit reichenden Floating-Point-Ebene am Digitalsignal vorgenommen. Für die professionell endbearbeitete Digitalaufnahme reichen dann am Schluß wieder die 16 Bit der CD für den perfekten Musikgenuß.

Alle aktuellen hochwertigen A/D- und D/A-Wandlerbausteine beherrschen zwar die 24-Bit-Auflösungen. Am Ende aber kommt es auf das jeweilige Know-How des Wandlerherstellers an, ob dieser in der Lage ist, einen hochexakten Wandler – ohne Eigenklang – damit zu applizieren. Es gibt derzeit mehr Wandlerdesigns, die über Eigenklang verfügen, als Wandler die praktisch ohne Eigenklang ihren Dienst verrichten! Letzteres zu beherrschen, ist deutlich schwieriger und aufwendiger und damit auch relativ seltener anzutreffen.

Hier ein paar weitere Verweise zu den besten Digitalwandlerprodukten:

Stagetec

http://www.stagetec.com/web/images/stories/kreuzschienen/nexus/components-overview-web-dt.pdf

http://www.stagetec.com/web/images/stories/kreuzschienen/nexus/components-overview-web-dt.pdf

Studer

http://www.studer.ch/products/product.aspx?pid=16

Prism Audio

http://www.prismsound.com/music_recording/products_subs/ada8xr/ada8xr_home.php

http://www.prismsound.com/music_recording/products_subs/orpheus/orpheus_home.php

RME Audio

http://www.rme-audio.de/products_hdspe_aes.php

http://www.rme-audio.de/products_hdspe_madi.php

http://www.rme-audio.de/products_adi_8_qs.php

Weiss Audio

http://www.weiss.ch/dac2/dac2.htm

http://www.weiss.ch/afi1/afi1.htm

 

Dieser Beitrag wurde unter Digitale Audiotechnik abgelegt und mit , , , , , , , , , , , , , , , , , , , , , , , , , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

Hinterlasse einen Kommentar