ESFZ – Erlanger SchülerForschungsZentrum für Bayern

Sprachsteuerung mit Zahlen – Spracherkennung mit einer KI

In meinem Projekt versuche ich einen Roboter zu bauen, der per Sprachbefehl über Zahlen gestuert werden kann. Im ersten Teil des Projektes habe ich mich in diesem ESFZ auf die Spracherkennung konzentriert und noch nicht genauer spezifiziert welche Aufgaben der Roboter später übernehmen soll.
Die Spracherkennung habe ich dabei über ein Neuronales Netz programmiert. Dafür habe ich zunächst die Zahlen 0, 1 und 2 jeweils 1000 Mal eingesprochen, um die Eingabeparameter für das Netz zu erhalten. Die Tonaufnahmen werden dann von einem in Python geschriebenen Programm auf den Teil gekürzt, in dem tatsächlich etwas zu hören ist (d.h. Sprechpausen werden herausgeschnitten) ehe diese Daten in das neuronale Netz eingegeben werden, um dieses zu trainieren.
Das neuronale Netz weist die Zahlen 0 und 1 mit 99.1 prozentiger Wahrscheinlichkeit korrekt zu. Bei der 2 gibt es vor allem beim schnellen Sprechen Probleme mit der richtigen Zuordung. An der Behebung davon arbeite ich aber mit einem zusätzlichen Traingssatz von schnellen 2ern für das neuronale Netz.

Felix Brunnbauer (Maximilian-Montgelas-Gymnasium)