Vom Sinn und Nutzen hoher Samplingfrequenzen bei HD-Digital Audio

Je nach kulturellem Hintergrund werden die Herren Nyquist, Shannon oder Kotelnikow, als die Väter des Abtasttheorems benannt. Das Abtasttheorem besagt, dass ein Signal, welches einer Bandbegrenzung unterliegt (also irgend eine höchste vorkommende Frequenz besitzt) und mit einer Abtastfrequenz abgetastet wird, die höher, als das Doppelte der höchsten vorkommenden Signalfrequenz ist, genau so wieder rekonstruiert werden kann.
Wohlgemerkt, das Abtasttheorem bezieht sich weder auf digitale Signale, noch lässt es Spielraum für eine begrenzte zeitliche Auflösung. Das rekonstruierte Signal ist identisch mit dem Originalsignal! Um aus (analogen) Abtastwerten wieder das originale Signal zu erzeugen, bedarf es des sogenannten Rekonstruktionsfilters. Als Rekonstruktionsfilter dient ein Tiefpassfilter, welches die höchste vorhandene Frequenz im Nutzsignal passieren lässt, aber alle Frequenzanteile die gleich oder größer als die halbe Abtastfrequenz sind, sicher unterdrückt. Wohl bemerkt, dieses Filter ist zwingend zur Rekonstruktion erforderlich und dieses Filter beeinträchtigt nicht das Nutzsignal, da es alle Frequenzen des Nutzsignals passieren lässt.
Eine höhere Abtastfrequenz hat somit eine höhere Bandbreite zur Folge oder auch eine höhere Auflösung.Wir erinnern uns das eine Verdopplung der Samplingfrequenz den Zugewinn von 1 Bit an Auflösung jeweils zur Folge hat! Wenn wir jedoch richtig gute A/D-Wandler verwenden, bei denen die 24 bit nicht mehr die Abtastwerte begrenzen, weil bereits andere Glieder in der Übertragungskette die Qualität des Signals beeinträchtigen, dann bringt auch eine Erhöhung der Abtastfrequenz keinen Gewinn für die zeitliche Auflösung. Richtig gute A/D Wandler im Sinne von echten 24 Bit an echt vprhandener Auflösung bedeutet das man bei dem Wandlern auch tatsächlich einen Rauschabstand von 144 dB über den Nutzfrequenzbereich messen kann! Würde man bei einem „24 Bit AD-Wandler“ allerdings beispielsweise nur 98 dB Rauschabstand messen dann bedeutet das eine echte bzw. effektive Auflösung von lediglich 16 Bit und bei 110 dB entspreche die effektive Auflösung dann nur 18 Bit….- egal was nominal an Bits auf dem AD-Wandler drauf steht… und der Rest ginge im Grundrauschen des Gerätes dann zwangsläufig unter…
Eine vergrößerte Bandbreite ist die Folge einer erhöhten Abtastfrequenz. Eine höhere Abtastfrequenz kann auch zu einer höheren zeitlichen Auflösung führen – muss es aber nicht! Keinesfalls ist eine höhere Nutzbandbreite gleich zu setzen mit einer höheren zeitlichen Auflösung! Hier wird also Ursache und Wirkung verdreht und es werden mit dieser Behauptung auch andere Einflüsse übersehen.

Ein Rechnenbeispiel:

Verglichen mit dem Audiosignal einer CD bringt der Übergang von 44,1 kHz zu 96 kHz in der Abtastfrequenz eine Erhöhung der zeitlichen Auflösung um das 2,17 fache, also um 6,7 dB.
Bei einer Veränderung der Bitbreite von 16 bit auf 24 bit (echte bit) unter Beibehaltung der Abtastfrequenz von 44,1 kHz vergrößert sich die zeitliche Auflösung um volle 48 dB! Oder besser gesagt, man kann die Zeit 256 Mal feiner auflösen. Die Audioabtastfrequenz bestimmt lediglich die höchste im Audiosignal darstellbare Frequenz. Die Audioabtastfrequenz bestimmt jedoch nicht die zeitliche Auflösung! Dies ist ein weit verbreiteter Irrtum!
Die höchste zu übertragende Nutzfrequenz wir durch die Abtastfrequenz bestimmt. Die zeitliche Auflösung des Nutzsignals wird durch die Amplitudenauflösung der Abtastwerte bestimmt sprich der tatsächlich effektiven Bit-Tiefe (Bitanzahl) die über den tatsächlichen Rauschabstand des AD-Wandlers bestimmt werden.
Die Beobachtungen das eine erhöhte Abtastfrequenz wirklich etwas bringt -außer die Erhöhung der oberen Grenzfrequenz stützen sich nach meinem Erfahrungsstand auf übliche A/D-Wandler am Markt und für die gilt, dass die effektive Bitbreite nicht immer ausreichend ist -sprich die nominalen 24 Bit garnicht wirklich nutzbar sind sondern die untersten 5-8 Bit im Grundrauschen des AD-Wandler verloren gehen.Die Beobachtungen vielerorts sind ganz bestimmt richtig beobachtet – nur die Erklärungen sind leider unvollständig und falsch. Eine Erhöhung der Abtastfrequenz kann tatsächlich zu einer Verbesserung der zeitlichen Auflösung führen, aber nicht durch die höhere Bandbreite, sondern durch die Erhöhung der Zahl der Stützstellen bei der Rekonstruktion!(Wir erinnern uns das durch eine Verdopplung der Abtastfrequenz ein Bit jeweils dazugewonnen werden kann…)
Die Erfahrungen vielerorts können in so fern bestätigt werden, dass es viele Fälle gibt, bei denen sich durch eine Verdopplung der Abtastfrequenz die zeitliche Auflösung verbessert. Dies geschieht jedoch nicht, durch die mögliche erhöhte Bandbreite des Audiosignals, die nun übertragen werden kann, sondern durch eine genauere Rekonstruktion des D/A-Wandlers auf Grund der Verdopplung der Stützstellen.
Für Anwender, die mit 28 oder gar 32 bit ihr Audiosignal quantisieren können, bringt eine Erhöhung der Abtastfrequenz keine erkennbaren Vorteile mehr! Wohl gemerkt mit 28 Bit ist dann auch der tatsächlich messbare Rauschabstand von 156 dB des Wandlersystem gemeint!
Den Zusammenhang zwischen feiner zeitlicher Auflösung und großer Bitbreite bei der Wandlung hat z.B. die Fa. Stage Tec erkannt und bietet deshalb seit nunmehr 15 Jahren einen A/D-Wandler mit extrem großer Bitbreite an, den TrueMatch-Wandler. Die große effektiv nutzbare Bitbreite ist das Geheimnis, weshalb z.b. der TrueMatch-A/D-Wandler eine hörbar große Tiefenstaffelung besitzt. Dieser Wandler ist einfach sehr genau in den Abtastwerten und daher kommt eine viel bessere räumliche Darstellung heraus. Das ist im dem Fall keine Hexerei sondern technisch ganz nüchtern real. Das hat im genannten Fall echte technische Hintergründe und ist keine Marketingparole die nur erdacht auf dem Schreibtischen von Werbefachleuten stattfand.Ein Beispiel aus einer Messumgebung mit der vorhandenen EMV die auf die Messtechnik an normalen Einsatzorten der Audiotechnik stets einwirken würde ist dabei ein gutes Stichwort und zwar gerade gegen unnötig hohe Samplingfrequenzen, denn umso höher tendenziell die eingesetzte Samplingfrequenz ist umso mehr HF-Müll wird in die entstehende WAV-Datei digitalisiert die nichts mit dem eigentlichen Audiosignal zutun hat….nach dem Motto jede HF sucht sich „irgendwo“ sicher ihre Demodulationsstrecke….

Vor dem Hintergrund von HF-Auswirkungen führten die Wissenschaftler Ashihara Kaoru und Kiryu Shogo vom japanischen Institut ETL verschiedene Experimente und Hörversuche durch, deren Ergebnisse auf der 7. AES Convention (Paper No. 5401) der Fachwelt präsentiert wurden. Hiernach wird die Existenz eigentlich unhörbarer Frequenzen unter anderem dann wahrgenommen, wenn sie zusammen mit weiteren komplexen, nicht sinusförmigen Signalen über ein nichtlinear übertragendes System wiedergegeben werden. Durch diese nichtlinearen Übertragungseigenschaften werden die höherfrequenten Signale in den Hörfrequenzbereich demoduliert. Übertragungsglieder der Audiokette, bei denen das nichtlineare Übertragungsverhalten relativ stark ausgeprägt ist, sind z.B. die Lautsprecher, über die das Musiksignal wiedergegeben wird. Unterschiede, die bei Hörversuchen via Übertragungsketten mit unterschiedlichen oberen Grenzfrequenzen (> 20 kHz) durchaus herausgehört werden, lassen sich auf zusätzliche niederfrequente Intermodulationsprodukte u.a. der Lautsprecher zurückführen, die dann auftreten, wenn diese mit höherfrequenten (Nutz-) Signalen angeregt werden. Vor diesem Hintergrund ist es keine gute Idee ein Audiosystem insbesondere Lautsprecher mit Signalen unnötig hoher Bandbreite jenseits der 20 kHz zu beaufschlagen.

Dieser Beitrag wurde unter Digitale Audiotechnik abgelegt und mit , , , , , , , , , , , , , , , , , , , , , , , , , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

Hinterlasse einen Kommentar