Notenerkennung mit dem WIDI Recognition System - Schritt für Schritt

Hier folgt ein spezielles Beispiel der Notenerkennung auf Basis einer MP3-Datei. Jeder Schritt ist mit Bildern und Demos illustriert.

Inhaltsverzeichnis:

Einleitende Bemerkungen.

Jeder Schritt dieses Tutorials besteht aus einer detaillierten Beschreibung, sowie Bildern und Demos im FLASH-Format. Wenn Sie auf die entsprechenden Vorschaubilder klicken, öffnen sich die Bilder und Demos in einem seperaten Fenster.

Die ausführlichen Beschreibungen der einzelnen Arbeitsschritte mit WIDI sind in einzelne Absätze unterteilt und durch einen kleineren Zeichensatz hervorgehoben. Wenn Sie sich mit der Bedienung von WIDI bereits gut auskennen, können Sie die jeweiligen Absätze überspringen. Die Beschriftungen von Schaltflächen und Eingabefenstern sind in fetter Schrift gehalten, während die Namen von Menüeinträgen kursiv geschrieben sind. Einige dieser Beschriftungen und Namen sind Verknüpfungen, die zu einer noch genaueren Erklärung der korrespondierenden Programmelemente führen.

Die verknüpften, detaillierten Beschreibungen aus der Online-Hilfe, die Abbildungen, sofern sie Bedienungselemente des Programms darstellen, und die FLASH-Demos sind in Englischer Sprache gehalten. Die Bezeichnungen in diesem Text beziehen sich auf die Deutsche Programmversion.

Alle im Tutorial erwähnten Dateien können heruntergeladen werden. Verknüpfungen zu herunterladbaren Dateien sind in dunkelrot hervorgehoben. Wir empfehlen zumindest die Ausgangs-MP3-Datei, die Ergebnis-MIDI-Datei, sowie die wne-Dateien herunterzuladen.
Am Besten ist es, alle in diesem Tutorial beschriebenen Schritte einmal selbst durchzuführen. Das ist der schnellste Weg, all die Besonderheiten der Arbeit mit dem Programm kennenzulernen.

Falls einige Stellen diese Tutorials unklar erscheinen oder unnachvollziehbar erklärt sind, wären wir Ihnen sehr dankbar, wenn Sie uns dies per E-Mail mitteilen. Diesen E-Mail-Link finden Sie auch am Ende jeder Seite dieses Tutorials.

Quellaudiodatei.

Als Arbeitsbeispiel wählen wir einen Ausschnitt aus Por Unos Dolares Mas aus dem Album Music of the Andes von Inka Wayra, das uns großzügig von dem Original-Autor diese Artikels zur Verfügung gestellt wurde.

Quellaudiodatei - Format: MP3, Größe:448 KB.

Zunächst sollten wir uns dieses Stück einmal anhöhren: Wir erkennen eine schnelle Gitarrenbegleitung durch das gesamte Stück. Kurz nach dem Anfang kommt eine Flöte dazu, die im zweiten Teil durch ein anderes Blasinstrument ersetzt wird - dies ist übrigens eine Chili, ein traditionelles panflötenartiges Instrument der Einwohner der Anden. Hier ist es wichtig, an zu merken, dass beide Blasinstrumente monophon gespielt werden.

Automatische Erkennung.

Erkennung mit den vorgegebenen Einstellungen.

Als erstes starten wir die Erkennung mit der "Werkseinstellung" ohne irgendwelche Parameter zu verändern. Wenn Sie die Erkennungsparameter noch nicht geändert haben, können Sie jetzt die Erkennung starten, anderenfalls benutzen Sie bitte die Standard-Schaltflächen in der Erkennungs-Einstellungen- und der Equalizer-Dialogbox.

Öffnen Sie die Erkennungs-Einstellungen-Dialogbox, indem Sie im Menü Optionen->Erkennungs-Einstellungen wählen oder auf das Icon in der Symbolleiste des Programms klicken. Klicken Sie Standard, dann خت.
Um die Equalizer-Dialogbox zu öffnen, benutzen Sie das Optionen->Equalizer einstellen-Menü oder das Icon in der Symbolleiste. In der Standardeinstellung sind alle Equalizer-Regler auf Maximalwert eingestellt. Wenn die augenblickliche Einstellung davon abweicht, benutzen Sie bitte die Standard-Schaltfläche. Klicken Sie auf die خت-Schaltfläche , um den Equalizer zu schließen.
Nachdem Sie die Parameter eingestellt haben, überprüfen Sie, ob das gesamte Lied angewält ist (die Start- und End-Felder der Auswahl stehen auf 0 and 57.13 Sekunden) und klicken Sie die -Schaltfläche in der Wave-Fenster-Symbolleiste.

Nachdem der Erkennungsprozess abgeschlossen ist, erscheint der TrueToneEditor mit dem Ergebnis. Sie können diese Fenster in der Abbildung 1 sehen.

Abbildung 1

Hinweis: Anders als in der 3.3 Version, erscheint das MIDI-Player-Fenster in der Version 3.2 entsprechend der Vorgabe. Um den TrueToneEditor zu öffnen, sollten Sie den MIDI-Datei im TrueTone Editor bearbeiten-Button hierin aniklicken oder einfach die Strg- und Enter-Tasten zusammen betätigen.

Anpassen der automatischen Erkennungsparameter.

Zuerst schauen wir uns die (Übersicht) im unteren Teil des Fensters an, die eine verkleinerte Ansicht der gesamten Spur anzeigt. Man kann deutlich eine gleichmäßige Melodielinien in der Übersicht erkennen. Das ist ein gutes Zeichen: wahrscheinlich braucht das Erkennungsergebnis nur noch wenig händische Überarbeitung.

Die Flöte setzt etwa nach vier Sekunde ein, und man erkennt ihren Part als zwei gleichmäßige Kurven, die in einem Abstand von einer Okatave voneinander entfernt sind. Eine Flöte ist jedoch ein monophones Instrument, wobei eine Oktave das Interval zwischen dem Grundton und dem ersten (stärksten) Oberton ist. Deshalb sollten wir die höhere Oktave löschen. Hierzu gibt es zwei Möglichkeiten: Entfernen der entsprechenden Noten aus dem Ergebnis oder Ändern der Erkennungs-Parameter, so dass der größte Teil dieser Noten erst gar nicht erkannt wird. Wobei die zweite Methode vorzuziehen ist, weil man dabei nicht mit Teilen des Spektrums hantieren muss, in denen keine musikalischen Informationen vorhanden sind, und die Genauigkeit in der Analyse des restlichen Teils erhöht wird. Die höchste Note in der Flötenstimme ist das (D-5), und es erscheint nach 22 Sekunden.
Genauso erkennt man, dass in der Begleitung keine Note unterhalb von (B-1) gespielt wird (und das erscheint nach 23 Sekunden). Hieraus folgern wir, dass sämtliche Noten, die als noch tiefer erkannt werden, fehlinterpretierte Geräusche sind und verworfen werden können.

Übrigens zeigen Experimente, dass es häufig sinnvoll ist, in einem Musikstück die Melodie mehr hervorzuheben (normalerweise ist sie die obere Stimme). Dies können Sie leicht mit dem Equalizer erreichen.

Öffnen Sie den Equalizer und bewegen Sie den Mauszeiger über den linken Equalizer-Balken. Ziehen Sie mit gedrückter linker Maustaste den Balken ganz nach unten bis zum Wert 0. Bewegen Sie die Maus nach rechts bis zur Note (A-1). Der rote Punkt und der Text oben im Equalizer-Fenster zeigen die aktuelle Note an. Machen Sie das Gleiche mit mit den hohen Frequenzen: vom äßersten rechten Balken bis zum D#-5. Zeichnen Sie dannach eine gleichmäßige Kurve über das verbleibende Spektrum und heben Sie dabei die hohen Frequenzen hervor.

Das folgende FLASH-Demo zeigt, wie der Equalizer einzustellen ist:

Abbildung 2 (Anklicken um das Demo abzuspielen)


Sie können auch eine Datei mit den Equalizer-Einstellungen (Dateiendung: .weqp) herunterladen und mit dem Import-Button in den Equalizer laden.


Die Datei mit den Equalizer-Einstellungen herunterladen.


Weiter >>

Fragen oder Anregungen? Mailen Sie uns.
Startseite | Beispiele | Voreinstellungen