Halten Sie einen Moment inne und denken Sie an das Internet ohne digitale Bilder oder Videos. Auf Facebook gäbe es keine Gesichter. Instagram und TikTok würden wahrscheinlich nicht existieren. Diese Zoom-Meetings, die auf dem Höhepunkt der COVID-19-Pandemie persönliche Treffen in der Schule oder am Arbeitsplatz ersetzten? Keine Option.

In unserer mit dem Internet verbundenen Welt ist digitales Audio genauso wichtig wie Standbilder und Videos. Es hat die Musikindustrie verändert, von der Produktion über den Vertrieb bis hin zur Art und Weise, wie Fans ihre Lieblingssongs kaufen, sammeln und aufbewahren.

Was haben diese Millionen Profile auf LinkedIn, Dating-Apps und Social-Media-Plattformen (und die endlose Auswahl an herunterladbarer Musik online) gemeinsam? Sie basieren auf einem Komprimierungsalgorithmus namens Diskrete Kosinustransformation (DCT), der eine wichtige Rolle bei der Übertragung digitaler Dateien über Computernetzwerke gespielt hat.

„DCT ist seit mehr als drei Jahrzehnten eine der Schlüsselkomponenten vieler Bild- und Videocodierungsalgorithmen“, erklärt Touradj Ebrahimi, Professor an der École Polytechnique Fédérale de Lausanne in der Schweiz und aktueller Vorsitzender des Standardisierungsausschusses JPEG. „Heute gibt es nur wenige Bildkomprimierungsstandards, die kein DCT verwenden“, fügt er hinzu.

Die Internetanwendungen, die wir täglich nutzen, die wir aber für selbstverständlich halten, wurden von Wissenschaftlern und Ingenieuren ermöglicht, die größtenteils anonym arbeiteten. Eine dieser „verborgenen Figuren“ ist Nasir Ahmed, der indisch-amerikanische Ingenieur, der einen eleganten Weg gefunden hat, die Größe digitaler Bilddateien zu reduzieren, ohne dabei auf die wichtigsten visuellen Details zu verzichten.

Ahmed veröffentlichte seine bahnbrechende Arbeit über den Komprimierungsalgorithmus zur diskreten Kosinustransformation, den er 1974 erfunden hatte, zu einer Zeit, als das entstehende Internet ausschließlich auf Text und Einwahl basierte. Den Worten waren keine Bilder beigefügt, und das konnte auch nicht der Fall sein, da die Internetdaten über Standard-Kupfer-Festnetztelefonleitungen übertragen wurden, was eine große Geschwindigkeits- und Bandbreitenbeschränkung darstellte.

„Heute gibt es nur wenige Bildkomprimierungsstandards, die kein DCT verwenden“, –Touradj Ebrahimi, EPFL

Dank ultraschneller Chips und Glasfasernetzen erreichen die Daten-Download-Geschwindigkeiten eines Laptops mit Glasfaseranschluss heute 1 Gigabit pro Sekunde. So kann ein Musikliebhaber in ein oder zwei Sekunden einen vierminütigen Song auf seinen Laptop (oder eher sein Smartphone) herunterladen. Im DFÜ-Zeitalter, als die Download-Geschwindigkeit der Internetnutzer 56 Kilobit pro Sekunde erreichte (und normalerweise halb so schnell war), hätte das Abrufen desselben Liedes von einem Server fast den ganzen Tag gedauert. Ein Bild auf einem Computerbildschirm erscheinen zu lassen, war ein Vorgang, der mit dem Zuschauen von Gras beim Wachsen vergleichbar war.

Ahmed war überzeugt, dass es eine Möglichkeit geben musste, die Größe digitaler Dateien zu reduzieren und den Prozess zu beschleunigen. Anschließend begab er sich auf die Suche, mit Einsen und Nullen darzustellen, was für die Lesbarkeit eines Bildes wesentlich ist, und weniger wichtige Elemente beiseite zu lassen. Es dauerte einige Zeit, bis die Antwort klar wurde, die sich auf die frühere Arbeit des Mathematikers und Pioniers der Informationstheorie Claude Shannon stützte. Aber durch seine Entschlossenheit und seinen unerschütterlichen Glauben an den Wert seiner Arbeit hielt Ahmed durch, selbst nachdem andere sagten, es sei es nicht wert.

Mit der Liebe zur Technik erzogen

Dass Ahmed eine Karriere in einem der MINT-Bereiche einschlagen würde, schien geradezu vorherbestimmt. Nasir wurde 1940 in Bengaluru, Indien, geboren und wuchs bei seinen Großeltern mütterlicherseits auf. Ahmeds Großvater war ein Elektroingenieur, der ihm erzählte, dass er 1919 in die Vereinigten Staaten geschickt wurde, um im General Electric-Werk in Schenectady, New York, zu arbeiten. Er erzählte seinem Enkel Geschichten aus seiner Zeit in den Vereinigten Staaten und ermutigte den jungen Nasir, dorthin auszuwandern, als es an der Zeit war, sein Studium fortzusetzen, nachdem er 1961 am Visvesvaraya University College of Engineering in Bengaluru einen Bachelor-Abschluss in Elektrotechnik erworben hatte. Genau das tat Nasir , verließ Indien im Herbst, um ein Aufbaustudium an der University of New Mexico in Albuquerque zu absolvieren. Ahmed erwarb 1963 bzw. 1966 den Master- und den Doktortitel in Elektrotechnik.

Während seines ersten Jahres in Albuquerque lernte er Esther Parente kennen, eine Doktorandin aus Argentinien. Sie werden schnell unzertrennlich und heiraten, während er an seiner Doktorarbeit arbeitet. Sechzig Jahre später sind sie immer noch zusammen.

Der Keim einer Idee

Im Jahr 1966 wurde Ahmed, frisch von der Schule und mit seinem Doktortitel, als leitender Forschungsingenieur in der neu gegründeten Computerabteilung von Honeywell eingestellt. Dort lernte Ahmed erstmals Walsh-Funktionen kennen, eine Technik zur Analyse digitaler Darstellungen analoger Signale. Obwohl die schnellen Algorithmen, die aus Walsh-Funktionen erstellt werden konnten, viele potenzielle Anwendungen hatten, konzentrierte sich Ahmed auf die Verwendung dieser Signalverarbeitungs- und Analysetechniken, um die Dateigröße durch digitale Bilder zu reduzieren, ohne zu viele visuelle Details in der unkomprimierten Version zu verlieren.

Diese Forschungsrichtung blieb sein Hauptinteresse, als er an die Wissenschaft zurückkehrte und 1968 eine Professur am Department of Electrical and Computer Engineering der Kansas State University annahm.

Ahmed war, wie Dutzende anderer Forscher auf der ganzen Welt, besessen davon, die Antwort auf eine einzige Frage zu finden: Wie kann man eine mathematische Formel erstellen, um die Einsen und Nullen im Binärcode zu entschlüsseln, der ein digitales Bild darstellt, das aufbewahrt werden sollte? was kann man wegwerfen? Das bei Honeywell erworbene Wissen lieferte ihm einen Rahmen, um die Elemente des Problems zu verstehen und anzugehen. Aber ein großer Teil des Verdienstes für diesen endgültigen Durchbruch ist Ahmeds unerschütterlicher Entschlossenheit und Risikobereitschaft zu verdanken.

1972 beantragte er ein Stipendium, das es ihm ermöglichen würde, die Monate zwischen dem Frühlings- und dem Herbstsemester an der University of Kansas der Weiterentwicklung seiner Ideen zu widmen. Er beantragte ein Stipendium der US National Science Foundation, wurde jedoch abgelehnt. Ahmed erinnert sich an diesen Moment: „Ich hatte das starke Gefühl, dass ich einen effektiven Weg finden könnte, digitale Signaldaten zu komprimieren. Doch zu meiner Überraschung hielten die Gutachter die Idee für zu einfach und lehnten den Vorschlag daher ab. »

Unbeeindruckt fragte Ahmed seine Frau, wie er das Gehalt, das er in den neun Monaten des Schuljahres verdient hatte, bis zum Sommer aushalten könne, damit er sich auf seine Forschung konzentrieren könne. Das Paar erinnert sich, dass das Geld knapp war, aber dieser Moment der finanziellen Einschränkung steigerte Ahmeds Fleiß nur. Sie hielten durch und Ahmeds lange Tage und lange Nächte im Labor brachten schließlich das gewünschte Ergebnis.

Die DCT-Komprimierung kommt zum Tragen

Ahmed kombinierte eine Technik zur Umwandlung des Arrays von Bildverarbeitungsdaten, die die Pixel eines Bildes darstellen, in eine Wellenform und machte sie so zu einer Reihe von Wellen mit oszillierenden Frequenzen, mit Kosinusfunktionen, die bereits zur Modellierung von Phänomenen wie Lichtwellen und Schall verwendet wurden Wellen und elektrischer Strom. Das Ergebnis war eine lange Zahlenfolge, deren Werte durch 1 und -1 begrenzt waren. Ahmed erkannte, dass durch die Quantifizierung dieser Wertefolge und die Durchführung einer Fourier-Transformation zur Zerlegung der Funktion in ihre Teilfrequenzen die einzelnen Pixeldaten auf eine Weise dargestellt wurden, die für die Entscheidung nützlich war, welche Datenpunkte beibehalten werden sollten und welche weggelassen werden könnten. Ahmed stellte fest, dass niederfrequente Wellen den notwendigen oder „informationsreichen“ Bereichen des Bildes entsprachen, während hochfrequente Wellen die weniger wichtigen Bits darstellten und daher angenähert werden konnten. Die von ihm und seinem Team erstellten komprimierten Bilddateien waren zehnmal kleiner als die Originale. Darüber hinaus könnte der Prozess umgekehrt werden und eine reduzierte Datendatei ein Bild erzeugen, das dem Original hinreichend ähnlich ist.

Nach zwei weiteren Jahren mühsamer Tests, in denen er und seine beiden Mitarbeiter Computerprogramme ausführten, die auf Datenlochkartensätzen geschrieben waren, veröffentlichte das Trio einen Artikel in IEEE-Transaktionen auf Computern mit dem Titel „Discrete Cosine Transform“ im Januar 1974. Obwohl die Veröffentlichung der Arbeit nicht sofort Klarheit brachte, war die weltweite Suche nach einer zuverlässigen Methode zur Durchführung der verlustbehafteten Komprimierung, die Claude Shannon in den 1940er Jahren postuliert hatte, abgeschlossen.

JPEG, MPEG und mehr

Erst 1983 begann die Internationale Organisation für Normung (ISO) mit der Arbeit an einer Technologie, die dem Text auf den Bildschirmen von Computerterminals Bilder in Fotoqualität hinzufügen würde. Zu diesem Zweck gründete die ISO die Joint Photographic Experts Group, besser bekannt unter der Abkürzung JPEG. Als 1992 der erste JPEG-Standard veröffentlicht wurde, waren DCT und Fortschritte einer Gruppe anderer Forscher zu Kernelementen ihrer Methode zur digitalen Komprimierung und Kodierung von Standbildern geworden. „Das ist das Schöne an der Standardisierung, wo Dutzende brillanter Köpfe hinter dem Erfolg von Fortschritten wie JPEG stehen“, sagt Ebrahimi.

Und da Videos als eine Abfolge von Standbildern beschrieben werden können, war Ahmeds Technik auch gut geeignet, die Größe von Videodateien zu reduzieren. DCT war die Komprimierungstechnik der Wahl, als ISO und die International Electrotechnical Commission (IEC) 1988 die Moving Picture Expert Group (MPEG) für die Komprimierung und Kodierung von Audio-, Video-, Grafik- und Genomdaten gründeten. Als der erste MPEG-Standard eingeführt wurde 1993 veröffentlicht wurde, war das World Wide Web, zu dem heute Google Maps, Dating-Apps und E-Commerce-Unternehmen gehören, erst vier Jahre alt.

Die Steigerung der Computergeschwindigkeit und der Netzwerkbandbreite in diesem Jahrzehnt sowie die Möglichkeit, Bilder und Videos über viel kleinere Dateien zu übertragen, veränderten das Internet rasant, bevor irgendjemand ahnen konnte, dass Amazon seinen Lesern eines Tages ermöglichen würde, Millionen von Büchern anhand ihres Covers zu beurteilen.

Nachdem er das Problem gelöst hatte, das mehrere Jahre lang seine Zeit und Aufmerksamkeit in Anspruch genommen hatte, begann Ahmed mit dem Rest seiner akademischen Laufbahn. Im Jahr 1993, dem Jahr der Einführung des ersten MPEG-Standards, verließ Ahmed die University of Kansas und kehrte nach Albuquerque zurück. Er nahm eine Stelle an seiner Alma Mater als Präsidentenprofessor für Elektrotechnik und Informationstechnik an. Diese Position hatte er an der University of New Mexico bis 1989 inne, als er zum Vorsitzenden der ECE-Abteilung befördert wurde. Fünf Jahre später wurde er Dekan der Ingenieurschule der UNM. Ahmed hatte diese Position zwei Jahre lang inne, bis er zum Vizeprovost für Forschung und Dekan für Graduiertenstudien ernannt wurde. Diese Position behielt er bis zu seinem Ausscheiden aus der Universität im Jahr 2001 und wurde zum emeritierten Professor ernannt.

Artikel auf Ihrer Website

Verwandte Artikel im Internet

By rb8jg

Leave a Reply

Your email address will not be published. Required fields are marked *