В настоящее время технологии обучения с подкреплением активно применяются во многих сферах, от ритейла до автономных транспортных средств. Может быть лучше: основной сложностью этого подхода является отсутствие размеченных данных, и, к сожалению, нет формализованного подхода как данные могут быть размечены для этой задачи. Другая сложность — это формализация функции вознаграждения. От удачного ее выбора, зависит конечный успех настройки алгоритма управления. 

В докладе будет рассказано о применении алгоритмов обучения с подкреплением к различным задачам: от простых игровых задач до задачи навигации мобильного робота. Так же будут представлены результаты сравнения различных алгоритмов в задачах избежания столкновения и навигации мобильного робота MIT RACECAR,  оснащенного лидаром.

Спикеры

Алексей Калинин
Алексей Калинин
Алексей Калинин

Инженер ЦИТМ Экспонента. В 2022 году закончил МФТИ по специальности “Биоинформатика и системная биология”.

Специализируется на математическом моделировании.