Google bietet kostenlose Metadatensätze mit Deep-Learning-KI und maschinellen Lernalgorithmen für eine schnelle und effiziente Bildklassifizierung in TensorFlow und PyTorch
Google hat die Verfügbarkeit mehrerer Datensätze angekündigt, die aus verschiedenen, aber begrenzten natürlichen Bildern bestehen. Der Suchriese ist zuversichtlich, dass die öffentlich verfügbaren Daten das Tempo des maschinellen Lernens und der künstlichen Intelligenz vorantreiben und gleichzeitig die Zeit zum Trainieren der KI-Modelle mit einer minimalen Datenmenge verkürzen werden. Google nennt die neue Initiative "Kostenlose Metadatensätze", mit deren Hilfe KI-Modelle mit weniger Daten "lernen" können. Die "Few-Shot AI" des Unternehmens ist optimiert, um sicherzustellen, dass AI aus nur wenigen repräsentativen Bildern neue Klassen lernt.
Um die Notwendigkeit zu verstehen, KI- und maschinelle Lernmodelle mit weniger Datensätzen schnell zu trainieren, hat Google "Meta-Dataset" eingeführt, eine kleine Sammlung von Bildern, mit deren Hilfe die zur Verbesserung der Genauigkeit von Algorithmen erforderliche Datenmenge reduziert werden soll. Das Unternehmen behauptet, dass die AI- und ML-Modelle mit wenigen Bildklassifizierungstechniken die gleichen Erkenntnisse aus viel weniger repräsentativen Bildern gewinnen werden.
Google AI kündigt Meta-Dataset an: Ein Dataset von Datasets für das Lernen mit wenigen Handgriffen:
Deep Learning für KI und maschinelles Lernen wächst seit geraumer Zeit exponentiell. Grundvoraussetzung ist jedoch die Verfügbarkeit hochwertiger Daten und dies auch in großen Mengen. Die großen Mengen manuell kommentierter Trainingsdaten sind oft schwer zu beschaffen und können manchmal auch unzuverlässig sein. Google hat die Verfügbarkeit einer Sammlung von Metadatensätzen angekündigt, um die Risiken großer Datenmengen zu verstehen.
Mit „Meta-Dataset: A Dataset of Datasets for Learning to Learn from Few Examples“ (vorgestellt auf der ICLR 2020) hat Google einen groß angelegten und vielfältigen Benchmark vorgeschlagen, um die Kompetenz verschiedener Bildklassifikationsmodelle in einer realistischen und herausfordernden Umgebung zu messen -shot-Einstellung, die einen Rahmen bietet, in dem mehrere wichtige Aspekte der Wenig-Schuss-Klassifizierung untersucht werden können. Im Wesentlichen bietet Google 10 öffentlich verfügbare und kostenlos verwendbare Datensätze natürlicher Bilder an. Diese Datensätze umfassen ImageNet, CUB-200-2011, Pilze, handgeschriebene Zeichen und Kritzeleien. Der Code ist öffentlich und enthält ein Notizbuch, das zeigt, wie Meta-Dataset in TensorFlow und PyTorch verwendet werden kann.
Die Wenig-Schuss-Klassifizierung geht über die Standardmodelle für Training und Deep Learning hinaus. Zur Testzeit ist eine Verallgemeinerung auf völlig neue Klassen erforderlich. Mit anderen Worten, die während des Tests verwendeten Bilder wurden im Training nicht gesehen. In einer Klassifizierung mit wenigen Schüssen enthält der Trainingssatz Klassen, die völlig unzusammenhängend mit denen sind, die zur Testzeit erscheinen. Jede Testaufgabe enthält a Support-Setvon einigen beschrifteten Bildern, aus denen das Modell etwas über die neuen Klassen und eine Disjunktion lernen kann Abfragesatzvon Beispielen, die das Modell dann klassifizieren soll.
Ein Metadatensatz ist eine große Komponente, bei der Modellstudien Verallgemeinerung auf völlig neue Datensätze, von denen im Training keine Bilder irgendeiner Klasse zu sehen waren. Dies ist zusätzlich zu der schwierigen Verallgemeinerungsherausforderung für neue Klassen, die mit dem Wenig-Schuss-Lern-Setup verbunden sind.
Wie hilft Meta-Dataset beim Deep Learning für KI- und maschinelle Lernmodelle?
Der Metadatensatz ist der bislang größte organisierte Benchmark für die datenübergreifende Klassifizierung von Bildern mit wenigen Aufnahmen. Außerdem wird ein Stichprobenalgorithmus zum Generieren von Aufgaben mit unterschiedlichen Merkmalen und Schwierigkeitsgraden eingeführt, indem die Anzahl der Klassen in jeder Aufgabe, die Anzahl der verfügbaren Beispiele pro Klasse, Klassenungleichgewichte und für einige Datensätze der Grad der Ähnlichkeit zwischen den Aufgaben variiert werden Klassen jeder Aufgabe.
Meta-Dataset bringt neue Herausforderungen für eine Klassifizierung mit wenigen Schüssen mit sich. Die Forschung von Google ist noch vorläufig und es gibt viel zu tun. Der Suchriese hat jedoch behauptet, dass Forscher Erfolg haben. Einige der bemerkenswerten Beispiele sind die Verwendung einer clever gestalteten Aufgabenkonditionierung, eine ausgefeiltere Optimierung von Hyperparametern, eine „Meta-Baseline“, die die Vorteile von Pre-Training und Meta-Learning kombiniert, und schließlich die Verwendung der Funktionsauswahl, um eine universelle Darstellung für jede Aufgabe zu spezialisieren .