Google spricht in einem aktuellen Blogbeitrag über die Bedeutung von Open Source und Open Data Open
Google als Unternehmen unterstützt seit jeher Open-Source-Software und -Daten, zumindest in seiner Haltung. Bei großen Unternehmen ist dies fast ein Trend, da sowohl Google als auch Microsoft herausragende Beiträge zur Open-Source-Szene geleistet haben. “Google leistet auch einen wichtigen Beitrag zu Open-Source-Software. Wichtige Beispiele hierfür sind Android, unser Smartphone-Betriebssystem, Chromium, die Codebasis für unseren Chrome-Browser (der jetzt auch viele Konkurrenten antreibt) und TensorFlow, unser System für maschinelles Lernen. Die Veröffentlichung von Kubernetes durch Google hat das Cloud-Hosting für immer verändert und Innovationen und Wettbewerb in der gesamten Cloud-Branche ermöglicht. Google ist auch der größte Anbieter von Open-Source-Code zu GitHub, einem gemeinsamen Repository für die Softwareentwicklung. Im Jahr 2017 haben Googler allein auf GitHub mehr als 250.000 Änderungen an Zehntausenden von Projekten vorgenommen.”
In den meisten Fällen geht es nicht wirklich um Großzügigkeit, sondern darum, von der freien Entwicklung zu profitieren und dann von einer breiten Akzeptanz zu profitieren. Unabhängig davon haben diese Beiträge Tausenden von Forschern geholfen und die Softwareentwicklung auf einheitliche Weise angeführt, was gefeiert werden sollte. Google hat kürzlich in einem Blogpost seinen Beitrag zu Open Data und Open-Source-Software hervorgehoben.
Mit dem Aufkommen des Echtzeit-Trackings und der Entwicklung fahrerloser Autos wird viel im Bereich Computer Vision geforscht und Google ist eines der Unternehmen an der Spitze von Visual Tech.
Google stützt sich auch auf viele Daten, die der NLP-Forschung helfen und Computern helfen können, die menschliche Sprache besser zu verstehen. In dem Blog-Beitrag hob Google die gemeinsame Nutzung einer Schlüsseldatenbank mit den Worten „In Bezug auf die Sprachverarbeitung haben wir die Natural Questions-Datenbank freigegeben, die 307.373 von Menschen erstellte Fragen und Antworten enthält. Wir haben auch das Trillion Word Corpus, das auf Wörtern basiert, die auf öffentlichen Webseiten verwendet werden, und den Ngram Viewer zur Verfügung gestellt, mit dem die mehr als 25 Millionen Bücher in Google Books durchsucht werden können. Diese Sammlungen können für statistische maschinelle Übersetzung, Spracherkennung, Rechtschreibkorrektur, Entitätserkennung, Informationsextraktion und andere Sprachforschung verwendet werden.“
Die Suchmaschine ist eines der Kerngeschäfte von Google und erhält jede Sekunde über 63.000 Anfragen. Diese Daten sind für das Unternehmen sehr wichtig und Google wertet diese Daten für gezielte Werbung aus. Dennoch werden einige Einblicke in die Gesamtdaten im Google Trends-Portal veröffentlicht.
“Google bietet auch Google Trends an, einen kostenlosen Dienst, der es jedem ermöglicht, die aggregierten Suchaktivitäten seit 2004 für die Google-Suche, die Bildersuche, die Nachrichtensuche, Shopping und YouTube anzuzeigen und herunterzuladen. Sie können monatlich, wöchentlich, täglich und sogar stündlich Suchinformationen für Länder, Regionen, Ballungsräume und Städte abrufen. Die Trends-Daten werden häufig von Forschern in so unterschiedlichen Bereichen wie Medizin und Wirtschaft verwendet. Laut Google Scholar gibt es mehr als 21.000 Forschungsarbeiten, die Trends als Datenquelle zitieren.“
Warum an Open-Source-Projekten arbeiten?
Darüber habe ich am Anfang des Artikels kurz gesprochen. Eine neue Software kann eine großartige Idee umsetzen und den Raum erneuern, aber das hindert andere nicht daran, ähnliche Ideen umzusetzen und dann daran zu arbeiten, sie zu verbessern. Viele Unternehmen haben es auf die harte Tour gelernt, zum Beispiel das Windows Phone. Wie wir wissen, war es aus vielen Gründen ein durchschlagender Misserfolg, aber eine geschlossene Umgebung und die Kontrolle der Lizenzierung waren ein großer Teil davon. Hardoop und HDFS waren Open-Source-Versionen von MapReduce, die von Google entwickelt wurden, und das Unternehmen hat schon früh die Bedeutung von Open Source erkannt. Zusammenfassend ist die Entscheidung, ein IP Open Source zu machen, eine strategische Entscheidung.
Google geht in seinem Blog-Post auf einige andere Gründe ein und sagt: „In erster Linie ist es unsere Hauptaufgabe, „die Informationen der Welt zu organisieren und sie universell zugänglich und nützlich zu machen“. Eine naheliegende Möglichkeit, Informationen allgemein zugänglich und nützlich zu machen, besteht darin, sie weiterzugeben!”
Sie sprechen auch darüber, warum sie einige Dinge nicht veröffentlichen können, in denen es heißt: "Natürlich können wir nicht alle Daten, die wir in unserem Geschäft verwenden, freigeben. Wir müssen die Privatsphäre der Nutzer schützen, die Vertraulichkeit für Geschäftskunden wahren und das geistige Eigentum von Google schützen. Aber vorbehaltlich solcher Überlegungen versuchen wir grundsätzlich, unsere Daten so „allgemein zugänglich und nutzbar“ wie möglich zu machen.“