Среда и вознаграждение;
Политика и агент;
Нейронные сети и обучение;
Развертывание.
Основы MATLAB и Simulink для моделирования систем и алгоритмов.
Продолжительность курса – 1 день.
Цель: Создать представление политики и сконструировать агента.
Представление политики с помощью нейронной сети;
Создание агента обучения с подкреплением в MATLAB;
Задание параметров моделирования для запуска симуляций.
Цель: Собрать нейронную сеть для обучения политики и агента.
Сборка нейронной сети;
Приложение Deep Network Designer;
Обучение агента;
Приложение Reinforcement Learning Designer.
Цель: Сгенерировать код на основе обученного агента.
Генерация кода;
Проверка кода.