Microsoft Word, Outlook und PowerPoint, um nach Azure-Diensten das KI-gestützte Tool für die automatische Bildunterschrift an großen Datensätzen zu trainieren
Microsoft hat bestätigt, dass es ein leistungsstarkes und intelligentes Bildunterschriftssystem entwickelt hat. Das KI-gestützte System kann schnell und selbstständig relevante Bildkationen generieren. Das System ist möglicherweise nicht so flüssig oder kreativ wie Menschen, die Bildunterschriften erstellen. Es wurde jedoch Berichten zufolge auf große Datenmengen trainiert, um die Relevanz und Genauigkeit zu verbessern. Microsoft stellt sicher, dass das System doppelt so leistungsfähig ist wie das in den Diensten des Unternehmens verwendete.
Microsoft hat ein neues System zur automatischen Untertitelung von Bildern. Das System wird zuerst in Azure Cognitive Services gestartet. Microsoft hat jedoch angedeutet, dass dasselbe auch auf Microsoft Word, Outlook und PowerPoint übertragen wird.
Wie funktioniert das neue AI-Drive-Bildunterschriften-System?
Jedes AI-gesteuerte System muss zuerst an relevanten Datensätzen geschult werden. Diese Algorithmen lernen aus den Datenpunkten und können dann die erwarteten Verhaltensmuster nachahmen. Berichten zufolge wird auch das neue automatische Bildunterschriften-System von Microsoft mit einem riesigen Datensatz von Bildern trainiert, die mit Wort-Tags gepaart wurden. Diese Wort-Tags wurden einem bestimmten Objekt in einem Bild zugeordnet.
Nach dem ersten Training haben die Forscher das vorab trainierte Modell für die Beschriftung des bereits beschrifteten Bilddatensatzes verfeinert. Der Trainings- und Feinabstimmungsprozess ermöglichte es dem KI-Modell zu lernen, wie man einen verständlichen Satz zusammensetzt. Das neue KI-Modell nutzt anschließend das visuelle Vokabular, um selbst Bildunterschriften für Bilder zu erstellen, die neuartige oder unterschiedliche Objekte genau enthalten. Es scheint, dass der Schwerpunkt auf dem Objekt liegt, das im Bild spezifisch oder einzigartig ist.
Wie bei allen AI-Modellen ist auch das Bildunterschriften-System von Microsoft nicht hundertprozentig genau oder perfekt. Microsoft stellt jedoch sicher, dass das neue AI-Modell doppelt so gut ist wie das Bildunterschriftenmodell, das derzeit in den Produkten und Dienstleistungen des Unternehmens verwendet wird. Interne Tests zeigen, dass das neue Modell Beschriftungen erstellen kann, die aussagekräftiger und genauer sind als die von Menschen manuell geschriebenen Beschriftungen, behauptet Xuedong Huang, ein technischer Mitarbeiter von Microsoft und Chief Technology Officer von Azure AI Cognitive Services in Redmond, Washington.
"Wir nutzen diesen KI-Durchbruch für Azure als Plattform, um eine breitere Kundengruppe zu bedienen." Es ist nicht nur ein Durchbruch in der Forschung; Die Zeit, die benötigt wurde, um diesen Durchbruch in Azure in die Produktion umzusetzen, ist ebenfalls ein Durchbruch. “
Huang wies darauf hin, dass Microsoft die Entwicklung, Verfeinerung und Bereitstellung von KI-Modellen, die mit von Menschen erstellten Inhalten konkurrieren können, erheblich beschleunigen kann. Es ist jedoch wichtig zu beachten, dass diese Modelle normalerweise bestimmten Richtlinien folgen und sich stark auf die Datensätze stützen.
Microsoft hat in den letzten Jahren hart daran gearbeitet, die Leistungsfähigkeit der KI für mehrere seiner Produkte und Dienstleistungen zu nutzen. KI hat die Kraft, die Produktivität zu steigern und gleichzeitig den Menschen die Freiheit zu geben, kreativere Aufgaben zu erledigen. Interessanterweise möchte Microsoft allen Benutzern helfen, über das neue automatische Bildunterschriften-System auf den wichtigen Inhalt eines Bilds für Menschen mit Sehbehinderung zuzugreifen.