Was ist Machine learning?

Abbildung: Computerschaltkreise überlagert eine Silhouette eines menschlichen Kopfes.

Maschinelles Lernen oder ML ist ein Zweig der KI, der sich auf die Erstellung von Computersystemen konzentriert, die Aufgaben ohne explizite Anweisungen ausführen. Anstatt Schritt für Schritt und von Fall zu Fall zu erfahren, wie etwas zu tun ist, „lernen“ ML-Systeme, indem sie wiederholt „Trainingsdaten“ (repräsentative Sätze von Beispielinformationen) verarbeiten. Die Ergebnisse der Verarbeitung werden danach bewertet, wie nahe sie einem gewünschten Ergebnis sind. Dieser Prozess wird mit den am besten bewerteten Algorithmen und Parametern wiederholt, die als Grundlage für neue verwendet werden.

ML ist nützlich, wenn eine Reihe von Eingabedaten umfangreich oder mit einem von Menschen geschriebenen Algorithmus nicht zu verarbeiten ist.

Geschichte

Der Ausdruck „maschinelles Lernen“ wurde 1959 von IBM-Ingenieur und KI-Pionier Arthur Samuel geprägt. Er entwickelte den Begriff, um einen Computer zu beschreiben, den er entworfen hatte, um Dame zu spielen, frühere Spiele zu analysieren und seine zukünftigen Spieloptionen zu verbessern.

Als wissenschaftliches Studiengebiet hat sich ML in den 1970er und 1980er Jahren von der KI abgezweigt. Zu dieser Zeit experimentierten Wissenschaftler mit verschiedenen KI-Techniken, darunter neuronale Netze und induktive Logikprogrammierung, um Computern bei der intelligenten Verarbeitung von Daten zu helfen. In den 1990er Jahren verlagerte ML seinen Fokus von der Simulation von Intelligenz auf die Suche nach praktischen Ansätzen für komplexe, massive Datenanalysen.

Arten von Lernalgorithmen

  • Beim überwachten Lernen hat jedes Stück Trainingsdaten eine Eingabe und ein „Etikett“ (eine vordefinierte beste Ausgabe). Eine Zielfunktion wird von dem System ausgeführt, um zu versuchen, zu dem Ausgang zu gelangen, der diesem Eingang zugeordnet ist. Anschließend wird diese Funktion wiederholt, wobei die Parameter geändert werden, bis die Funktion erfolgreich Daten verarbeiten kann, die nicht im Trainingssatz enthalten sind.
  • Beim unüberwachten Lernen sind Trainingsdaten „unbeschriftet“, was bedeutet, dass die gewünschte Ausgabe dem Algorithmus nicht bereitgestellt wird. Diese Algorithmen konzentrieren sich darauf, Muster und Strukturen in den Daten zu finden.
  • Beim halbüberwachten Lernen werden einige der Trainingsdaten beschriftet, andere nicht. Wissenschaftler haben herausgefunden, dass diese Algorithmen in einigen Fällen besser abschneiden als unüberwachtes Lernen und effizienter als überwachtes Lernen.
  • Beim aktiven Lernen versucht der Algorithmus, das Gleichgewicht der Ãœberwachung (Kenntnis der Ergebnisse) zu optimieren. Es wählt repräsentative Eingabedaten aus und bittet einen Menschen, interaktiv die beste Ausgabe für diese Eingaben bereitzustellen. Im Internet werden Benutzer oft aufgefordert, Fotos zu identifizieren, um „zu beweisen, dass Sie ein Mensch sind“, was als CAPTCHA bezeichnet wird. Antworten auf diese Aufgaben, wie „alle Fotos auswählen, die Ampeln enthalten“, werden aktiven Lernalgorithmen zugeführt, wie sie beispielsweise zur Verbesserung des Computersehens in autonomen Fahrzeugen verwendet werden.
  • Beim Reinforcement Learning konzentrieren sich Algorithmen darauf, wie die Chancen auf eine quantifizierbare Belohnung erhöht werden können. Ein Beispiel für diese Art von kumulativer Belohnung ist das Nehmen einer gegnerischen Figur in einem Schachspiel. Beim Schach ist ein Bauer 1 wert, Springer und Läufer sind 3 wert (ungefähr der Wert von drei Bauern), eine Dame ist 9 wert usw. Algorithmen, die den materiellen Vorteil im Laufe des Spiels erhöhen, erhöhen die Wahrscheinlichkeit, das Spiel zu gewinnen. Reinforcement Learning findet Anwendung in Spieltheorie, Schwarmintelligenz und genetischen Algorithmen.

Software

Die folgende Software und Dienste implementieren ML:

  • Amazon Machine Learning – Maschinelles Lernen auf der AWS-Cloud-Plattform.

  • Cloud AutoML – ML-Dienste, die auf der Google Cloud Platform gehostet werden.

  • Cloud TPU – Ein proprietärer Google-Dienst zur Beschleunigung des maschinellen Lernens.

  • MATLAB – Eine numerische Computerumgebung und Programmiersprache, entwickelt von MathWorks.

  • Mathematica – Eine Computer-, Analyse- und Visualisierungsumgebung für fortgeschrittene Mathematik, erstellt von Stephen Wolfram.

  • Octave – Eine Open-Source-Programmiersprache für wissenschaftliche Analysen und Datenvisualisierung, entwickelt vom GNU-Projekt.

  • Orange – Eine Open-Source-ML- und Data-Mining-Umgebung, die für Anfänger, Wissenschaftler und Fachleute geeignet ist.

  • PyTorch – Eine skalierbare Deep-Learning-Plattform, die in die Programmiersprache Python integriert ist und Zugriff auf die große Auswahl an datenwissenschaftlichen Bibliotheken von Python gewährt.

  • Spark MLlib – Eine ML-Komponente von Spark, der von der Apache Software Foundation entwickelten Open-Source-Plattform für verteiltes Rechnen.

  • Splunk – Eine von Splunk entwickelte Softwareplattform für die Echtzeit-Datenanalyse mit ML. Inc.

  • TensorFlow – Eine in C++, Python und CUDA geschriebene ML-Plattform. Es wurde von Google für den internen Gebrauch entwickelt und im November 2015 für die öffentliche Nutzung freigegeben.

Ambient Computing, Begriffe der Künstlichen Intelligenz, Distributed Computing, Logikprogrammierung, Maschine, Neurales Netzwerk

Neueste Artikel
Vielleicht möchten Sie lesen

LEAVE A REPLY

Please enter your comment!
Please enter your name here