Reinforcement Learning Toolbox
Entwurf und Training von Strategien mithilfe von Reinforcement Learning
Haben Sie Fragen? Vertrieb kontaktieren.
Haben Sie Fragen? Vertrieb kontaktieren.
Die Reinforcement Learning Toolbox™ bietet eine App, Funktionen und einen Simulink®-Block zum Trainieren von Richtlinien mit Reinforcement-Learning-Algorithmen wie DQN, PPO, SAC und DDPG. Mithilfe dieser Richtlinien können Sie Steuerungen und Entscheidungsalgorithmen für komplexe Anwendungen wie Ressourcenzuweisung, Robotik und autonome Anlagen implementieren.
Die Toolbox ermöglicht das Darstellen von Richtlinien und Wertefunktionen durch tiefe neuronale Netze oder Lookup-Tabellen und ihr Trainieren durch die Interaktion mit Umgebungen, die als MATLAB®- oder Simulink-Modelle dargestellt werden. Sie haben die Möglichkeit, die in der Toolbox bereitgestellten Single-Agent- oder Multi-Agent-Reinforcement-Learning-Algorithmen zu evaluieren oder eigene zu erstellen. Sie können mit Hyperparameter-Einstellungen experimentieren, den Trainingsfortschritt überwachen und trainierte Agents entweder interaktiv durch die App oder per Programm simulieren. Um die Trainingsleistung zu optimieren, können Sie parallele Simulationen auf mehreren CPUs, GPUs, in Computer-Clustern und in der Cloud (mit der Parallel Computing Toolbox™ und MATLAB Parallel Server™) ausführen.
Durch das ONNX™-Modellformat lassen sich vorhandene Richtlinien aus Deep-Learning-Frameworks wie TensorFlow™ Keras und PyTorch (mit der Deep Learning Toolbox™) importieren. Sie können optimierten C, C++ und CUDA® Code generieren, um trainierte Richtlinien auf Microcontrollern und GPUs anzuwenden. Die Toolbox beinhaltet Referenzbeispiele, um Ihnen die ersten Schritte zu erleichtern.
Erstellen Sie Agenten mithilfe von Deep Q-Network (DQN), Deep Deterministic Policy Gradients (DDPG), Proximal Policy Optimization (PPO) und anderen integrierten Algorithmen. Verwenden Sie Vorlagen, um individuelle Agenten zum Trainieren von Richtlinien zu entwickeln.
Entwerfen, trainieren und simulieren Sie interaktiv Reinforcement-Learning-Agenten. Exportieren Sie trainierte Agents in MATLAB zur weiteren Verwendung und Bereitstellung.
Definieren Sie tiefe neuronale Netzrichtlinien programmatisch für komplexe Systeme mit großen Zustands-/Handlungsräumen mithilfe von Schichten aus der Deep Learning Toolbox oder interaktiv mit dem Deep Network Designer. Alternativ können Sie die Standardnetzarchitektur verwenden, die die Toolbox vorschlägt. Initialisieren Sie die Richtlinie mithilfe von Imitation Learning, um das Training zu beschleunigen. Importieren und exportieren Sie ONNX-Modelle, um die Kompatibilität mit anderen Deep Learning-Frameworks zu gewährleisten.
Erstellen und trainieren Sie Reinforcement-Learning-Agenten in Simulink mit dem RL-Agentenblock. Trainieren Sie mehrere Agenten gleichzeitig (Multi-Agent-Reinforcement-Learning) in Simulink mithilfe mehrerer Instanzen des RL-Agentenblocks.
Verwenden Sie Simulink- und Simscape™-Modelle für die Darstellung einer Umgebung. Bestimmen Sie Beobachtungs-, Handlungs- und Belohnungssignale innerhalb des Modells.
Verwenden Sie MATLAB-Funktionen und -Klassen für die Modellierung einer Umgebung. Bestimmen Sie Beobachtungs-, Handlungs- und Belohnungsvariablen innerhalb der MATLAB-Datei.
Beschleunigen Sie das Training, indem Sie parallele Simulationen auf Mehrkerncomputern, Cloud-Ressourcen oder Computerclustern mithilfe der Parallel Computing Toolbox und MATLAB Parallel Server durchführen.
Beschleunigen Sie das Training und die Inferenz tiefer neuronaler Netze mit leistungsstarken NVIDIA®-GPUs. Verwenden Sie MATLAB mit der Parallel Computing Toolbox und den meisten CUDA-fähigen NVIDIA-GPUs mit einer Rechenfähigkeit ab Version 3.0.
Verwenden Sie den MATLAB Coder™, um optimierten CUDA Code aus MATLAB Programmcode zu generieren, der trainierte Richtlinien darstellt. Verwenden Sie MATLAB Coder™, um C/C++ Code zur Bereitstellung von Richtlinien zu generieren.
Mit MATLAB Compiler™ und MATLAB Compiler SDK™ können Sie trainierte Richtlinien als eigenständig ausführbare Anwendungen, C/C++ Shared Libraries, Microsoft®.NET Assemblies, Java®-Klassen und Python®-Pakete bereitstellen.
Sehen Sie zu, wie Sie auf Reinforcement Learning basierende Steuerungen für Probleme wie den Ausgleich eines inversen Pendels, die Navigation im Grid-World-Labyrinth, den Ausgleich eines Wagen-Pendel-Systems und das Lösen generischer Markov-Entscheidungsprozesse entwickeln.
Entwerfen Sie Reinforcement-Learning-Richtlinien für Anwendungen des automatisierten Fahrens wie adaptive Tempomaten, Spurhalteassistenten und Einparkhilfen.
Entwerfen Sie Reinforcement-Learning-Richtlinien für Roboteranwendungen.
Entwerfen Sie Reinforcement-Learning-Richtlinien zur Feinabstimmung, Kalibrierung und Terminierung von Anwendungen.
Erfahren Sie in dieser Videoreihe mehr über Reinforcement Learning.