Подбор регрессионной модели в интерактивном режиме с помощью приложения Regression Learner
Подбор регрессионной модели в интерактивном режиме с помощью приложения Regression Learner

Что входит в курс:

  • Обработка данных;

  • Описательная статистика;

  • Визуализация данных;

  • Подбор распределений;

  • Выполнение гипотезы тестов;

  • Дисперсионный анализ;

  • Подбор регрессионных моделей;

  • Уменьшение размерности данных;

  • Генерация случайных чисел и выполнения симуляций.

Предварительная подготовка:

Практические знания MATLAB (MLBE) и базовой статистики.

Продолжительность курса - 2 дня.

Подбор регрессионной модели в интерактивном режиме с помощью приложения Regression Learner Подбор регрессионной модели в интерактивном режиме с помощью приложения Regression Learner

Программа

  • Импорт и организация данных.
  • Исследование данных.
  • Параметрические и непараметрические распределения.
  • Гипотезы тесты.
  • Дисперсионный анализ.
  • Регрессионный анализ.
  • Обработка данных высокой размерности.
  • Генерация случайных чисел.

Импорт и организация данных

Понимание методов импорта для различных типов данных, доступных в MATLAB и Statistics Toolbox, для дальнейшей организации и анализа. Выполнение общих задач, таких как объединение данных и работа с недостающими данными.

  • Импорт данных;
  • Типы данных;
  • Тип данных Dataset
  • Объединение данных;
  • Категории данных;
  • Несоразмерные и отсутствующие данные.

Исследование данных

В данном модуле рассматриваются основные статистические исследования данных, включая визуализацию и расчет сводных статистических данных.

  • Статистическая визуализация;
  • Среднее значение;
  • Разброс;
  • Форма;
  • Корреляция;
  • Группированные данные.

Параметрические и непараметрические распределения

В этом модуле освещаются функциональности, доступные в Statistics Toolbox, для исследования различных распределений вероятности и подбора их параметров.

  • Распределения вероятностей;
  • Параметры распределения;
  • Сравнение и подбор распределений;
  • Непараметрические распределения;
  • Задание распределения в виде объекта.

Гипотезы тесты

Использование Statistics Toolbox, для определения вероятности принадлежности классу распределений. Применить тест гипотезу для общего использования, таких как сравнение двух распределений и определения доверительных интервалов для выборок.

  • Проверка гипотезы;
  • Тест на принадлежность нормальному распределению;
  • Тест на проверку произвольного распределения.

Дисперсионный анализ

В этом модуле рассматриваются задачи сравнения выборочных средних нескольких групп и нахождение статистически значимых различий между группами.

  • Множественные сравнения;
  • Одномерный ANOVA анализ;
  • N-мерный ANOVA анализ
  • Многомерный ANOVA анализ;
  • ANOVA анализ для произвольного распределения;
  • Категориальная корреляция.

Регрессионный анализ

Выполнение предсказательного моделирования на основе подбора линейной и нелинейной модели. Исследование техник для повышения качества модели.

  • Модели линейной регрессии;
  • Подбор линейной модели по исходному множеству данных;
  • Оценка модели;
  • Настройка модели;
  • Графики разбросов;
  • Логистическая и обобщенные линейные модели;
  • Нелинейные модели.

Обработка данных высокой размерности

Знакомство с методами снижения размерности набора данных, а также выполнение классификации для случая категориальной переменной.

  • Преобразования компонент;
  • Выбор характеристик;
  • Классификация;
  • Кластеризация.

Генерация случайных чисел

Использование случайных чисел для оценки неопределенности или чувствительности модели, или выполнения симуляций. Генерация случайных чисел из различных распределений и управление алгоритмами генерации случайных чисел.

  • Бутстреп и симуляция;
  • Генерация случайных чисел из нормального распределения;
  • Генерация случайных чисел из произвольного распределения;
  • Управление потоком случайных чисел.