Обучение с подкреплением одна из наиболее сложных и интересных областей в которой с успехом применяются технологии глубокого обучения.

В этом стриме мы рассмотрим общую концепцию обучения с подкреплением (Reinforcement Learning). На простых и доступных примерах покажем, как создать и обучить алгоритмы управления. 

Основные темы стрима:

  • Что такое обучение с подкреплением
  • Составляющие рабочего процесса
  • От Q-обучения к глубокому Q-обучению
  • Создание и настройка MATLAB/Simulink окружения
  • Определение политики и функции стоимости (policy and value function)
  • Создание агента (agent)
  • Обучение и валидация агента

Спикеры

Артем Багров
Артем Багров
Артем Багров

Инженер ЦИТМ Экспонента, к.т.н. В 2004 году окончил МГУ им. Ломоносова, в 2008 защитил кандидатскую диссертацию. Работает в компании с 2010 года. Специализируется на технических вычислениях и мат. моделировании.

Условия участия

При регистрации в поле "Цель посещения" необходимо указать результат команды VER триальной версии или лицензии MATLAB, которую вы используете в работе. Для этого выполните в MATLAB команду "ver -support". Cкопируйте то, что она выдаст (Ctrl+C) и вставьте в поле "Цель посещения" (Ctrl+V).

Регистрация на этот вебинар откроется позднее.

Услуги

Продукты