Der Echtzeit-Handverfolgungsalgorithmus von Google verwendet das Smartphone, um die Erkennung der Gebärdensprache zu verbessern
Die Gebärdensprache wird von Millionen von Menschen auf der ganzen Welt verwendet. Forscher haben daran gearbeitet, Technologien zu entwickeln, die die Gesten verstehen und automatisch in eine für den Menschen verständliche Sprache umwandeln können. Solche Projekte haben jedoch hinsichtlich der Genauigkeit keinen großen Erfolg erzielt.
Google hat kürzlich einen Algorithmus entwickelt, der für die Handverfolgung in Echtzeit verwendet werden kann. Das intelligente System nutzt maschinelles Lernen, um eine Karte der Hand zu erstellen. Die Karte wird mit Hilfe einer Kamera oder eines Smartphones erstellt. Wir können nicht leugnen, dass die meisten Systeme schnelle Handbewegungen nicht genau erfassen. Google hat dieses Problem in dieser Studie speziell angesprochen. Interessanterweise haben sie die Datenmenge begrenzt, die zuvor von den Algorithmen verarbeitet wurde.
Wie funktioniert die Echtzeit-Handverfolgung?
Die meisten bestehenden Projekte übersetzen die Gebärdensprache, indem sie die Größe und Position der gesamten Hand ermitteln. Mit dieser Forschung. Die Forscher haben die Notwendigkeit beseitigt, rechteckige Formen in verschiedenen Größen zu handhaben. Das Google-System erkennt nur die quadratische Handfläche. Zweitens wird ein separater Analyseprozess für die Finger durchgeführt.
Die Forscher verwendeten rund 30.000 Handbilder, um den Algorithmus für maschinelles Lernen zu trainieren. Diese Bilder wurden unter verschiedenen Aufhellungsbedingungen und in verschiedenen Posen aufgenommen. Das System erkennt dann die Geste, indem es einen Vergleich zwischen der Handhaltung und einer Liste bekannter Entitäten wie einem Ball oder Glück macht. Google beschreibt die Gestenerkennung in einem Blogbeitrag.
Der endgültige Hand-Tracking-Algorithmus liefert hinsichtlich seiner Geschwindigkeit und Genauigkeit modernste Ergebnisse. Der Algorithmus verwendet zum Ausführen das MediaPipe-Framework. Diese Technik scheint ein großer Fortschritt im Bereich der Gebärdensprache zu sein. Obwohl es noch viel Raum für Verbesserungen gibt. um ein besseres Verständnis der Gebärdensprache zu schaffen. Jeder kann diese Arbeit erweitern, um Gesichtsausdrücke und beide Hände zu verwenden, um bessere Ergebnisse zu erzielen.
Obwohl es kein Wort von Google gibt, besteht die Möglichkeit, dass Google diese Echtzeit-Handverfolgungstechnologie verbessern kann, um sie in seinen Produkten zu verwenden. Wenn Sie mit dem Code herumspielen möchten, ist er in der Zwischenzeit auf GitHub öffentlich verfügbar.